买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:浙江大学
摘要:本发明公开了一种基于机器学习的老年人营养健康状态评估与风险预测系统。该系统包括数据获取与特征筛选模块、营养健康状态评估模型构建模块、风险预测模块、营养健康状态分析与建议模块;本发明结合大数据与机器学习算法,纳入分析膳食信息、机体功能状态、生物标志物等营养健康状态相关的多维度特征,构建了基于CatBoost的营养健康状态评估模型,将人群划分为高、中、低、健康人群以提供风险预测信息,进而通过机器学习可解释技术提供个性化建议;本发明能够助力老年人实时而快速地掌握自身的营养健康状态,促进医疗保健人员对老年人营养健康状态的干预。
主权项:1.一种基于机器学习的老年人营养健康状态评估与风险预测系统,其特征在于,包括:1数据获取与特征筛选模块:获取大规模的老年人健康因素相关的队列数据,初步确定所能纳入的所有特征信息;提炼临床常用的各项相关指标与营养健康专家知识,筛选得到可用的有效特征,构建结构化的特征集并进行预处理;2营养健康状态评估模型构建模块:以数据获取与特征筛选模块得到的特征为输入,以样本的死亡时间为真实标签,构建数据集;通过CatBoost构建营养健康状态评估模型,同时采取交叉验证的方式验证模型的泛化性,通过网格搜索调优模型参数提高模型综合性能;通过序列浮动后向选择算法对全部有效特征进行筛选;所述营养健康状态评估模型构建模块中,将特征集矩阵化为原始数据集X,Y,X=[x1,x2,x3,…,xn],其中n为样本量,xi=[xi1,xi2,xi3,…,xim]为单独样本的特征值,其中m为特征数,xim代表xi相应的特征值,其范围依数据类型而定;Y=[y1,y2,y3,…,yn]为样本的真实标签,数值为0或1,表示样本的生存或死亡信息;采用能够对分类变量进行无偏处理的提升树模型CatBoost构建营养健康状态评估模型;采用GreedyTS策略对类别型特征进行处理,即通过添加先验分布项做平滑处理,消除低频率类别型数据以及噪声数据对于数据集分布的影响,具体为:对样本集X进行随机排序,序列记为σ=σ1,σ2,...,σn,假设样本xi的第k个维度特征xik为类别特征,则对xik调整后的特征值为: 其中,D={xi,yi}i=1,...,n为训练样本集,对于训练样本,Di={xj:σj<σi}表示序列中位于xi之前的部分样本集,对于测试样本,Di=D;[·]为指示函数,当xjk=xik时其值为1,当xjk≠xik时其值为0;P为先验值,α为先验值P的权重;所述营养健康状态评估模型构建模块中,采取交叉验证的方式划分训练集与测试集进行模型的训练和验证,其中交叉验证的折数为5;同时,通过网格搜索模型的参数空间,寻找最优参数提高模型性能,搜索的参数范围包括:树的数量、学习率、树的深度、Bootstrap类型、Bagging温度、树生长策略、L2正则参数;以F1为优化目标进行参数搜索:F1=2×precision×recallprecision+recall其中,precision为预测精度,recall为预测召回率;通过在训练集上的参数搜索与交叉验证,构建性能最优的营养健康状态评估模型,并在测试集上进行测试,评价指标为受试者曲线与精度-召回率曲线;3风险预测模块:以营养健康状态评估模型为基础,设定相应阈值划分人群为健康、低风险、中风险、高风险人群,进而根据人群区分与真实的生存信息,绘制生存曲线;实际应用时,只需输入当前个体的各项指征,通过营养健康状态评估模型的运算即得到相应的评分,划分为对应人群,并对照相应的生存曲线了解后续风险;4营养健康状态分析与建议模块:以营养健康状态评估模型为基础,在个体进行营养健康状态评估时,通过SHAP算法对具体的特征指标进行详细分析,了解各个特征重要性以及对结果的影响,进而提供更具体而精确的建议;所述营养健康状态评估模型构建模块中,为避免梯度提升树模型训练时产生的预测偏移,采取排序提升的方式减少梯度偏差,具体为:设模型的最大迭代数为T,在每一轮迭代t中,对所有样本进行随机排序得到序列σ=σ1,σ2,...,σn,对每一个样本,初始化样本对应的模型Mi=0,i=1,…,n,计算样本xi的无偏残差ri:ri=yi-Mσi-1xi其中,σi表示样本i在本轮的排序,Mσi-1为前一个样本训练得到的模型,Mσi-1xi为该模型下xi的输出,从而获得xi的无偏残差ri来继续训练更新的决策树ΔM,将其更新至模型Mi=Mi+ΔM,因此每轮都需要训练n个模型;T轮迭代结束后,T轮的模型Mn即为最终模型。
全文数据:
权利要求:
百度查询: 浙江大学 基于机器学习的老年人营养健康状态评估与风险预测系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。