买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国人民解放军国防科技大学
摘要:本发明提供了一种基于连续优化的因果发现方法、装置、设备及介质,方法包括:获取疾病诊断数据样本集;通过高斯混合核聚类对疾病诊断数据样本集进行聚类,得到多个样本集;利用课程学习机制对样本集进行自适应训练,根据训练过程不同样本的表现,将样本分为课程样本和候选样本,并随着训练过程的迭代,根据每一阶段的候选样本表现不断更新并确定下一阶段的课程样本,最终学习到全部的训练样本;通过动态权重剪枝,根据不同课程学习阶段的课程学习结果动态调整学习边的权重;根据权重矩阵得到因果结构,根据因果结构,获取与疾病相关的影响因素之间的因果关系。本发明减少了数据中样本噪声的影响,具有良好的泛化能力和较高的准确度。
主权项:1.一种基于连续优化的因果发现方法,其特征在于,包括:S101,获取待学习的疾病诊断数据样本集;其中,所述疾病诊断数据样本集由结构方程模型建模得到,所述结构方程模型由权重矩阵决定;S102,通过高斯混合核聚类的方法对所述疾病诊断数据样本集进行聚类,得到特征间相似度高的多个样本集;S103,利用课程学习机制对样本集进行自适应训练,根据训练过程不同样本的表现,将样本分为课程样本和候选样本,并随着训练过程的迭代,根据每一课程学习阶段的候选样本表现不断更新并确定下一课程学习阶段的课程样本,最终学习到全部的训练样本;其中,在迭代过程中,通过动态权重剪枝,根据不同课程学习阶段的课程学习结果动态调整学习边的权重,并在迭代结束后得到最终的权重矩阵;S104,根据最终的权重矩阵得到因果结构,根据所述因果结构,获取到与待诊断疾病相关的影响因素之间的因果关系,从而找到待诊断疾病的直接影响因素和间接影响因素,以辅助疾病的诊断过程,其中在步骤S103中,不同样本的表现通过基于无环性约束设计的课程损失函数来评估,课程损失函数表示为: ;其中,表示第个课程学习阶段候选样本集中的第个样本,表示权重矩阵,也代表样本在个节点上学习到的图,表示候选样本集中的样本数量,表示课程学习阶段,表示第个课程学习阶段的权重矩阵,表示第个课程学习阶段的课程样本集;并且步骤S103具体包括:根据课程损失函数获得样本训练过程中的损失,并根据损失更新调整样本学习次序,进而更新课程样本和候选样本;其中,将损失值最小的样本作为下一课程学习阶段的课程样本,并从候选样本集中剔除该样本: ;其中,表示第个课程学习阶段的候选样本集;在课程样本的每个课程学习阶段,从课程样本集中学习,其约束方程如下: ;使用增广拉格朗日方法来转换约束方程为无约束方程序列,利用增广拉格朗日方法构造得分函数来优化上述约束方程,相应的增广拉格朗日公式如下: ; 表示惩罚参数,表示拉格朗日乘数的估计;当趋于无穷大时,最小化需要满足,通过逐渐增加,最小化增广拉格朗日,并更新拉格朗日乘子以收敛到最优条件;并且在步骤S103中,在迭代过程中,通过动态权重剪枝,根据不同课程学习阶段的课程学习结果动态调整学习边的权重,并在迭代结束后得到最终的权重矩阵,具体包括:首先,计算边的权重和权重系数;其中,设置边的权重,则: ;其中,表示课程学习阶段的权重矩阵,表示总是出现在第个课程学习阶段及之前边的权重矩阵;表示出现在下一课程学习阶段的新边的权重矩阵;表示具有在此之前课程学习阶段出现然后消失的边的权重矩阵;计算分数,其中,BIC评分函数如下: ;通过计算分数确定来更新和中边的权重: ;其中,表示节点为的DAG,是在中增加了和中边权重不为0的额外边,为权重更新矩阵,对应边的权重更新系数;根据更新的和得到更新的权重矩阵,并在迭代结束后得到最终的权重矩阵。
全文数据:
权利要求:
百度查询: 中国人民解放军国防科技大学 基于连续优化的因果发现方法、装置、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。