买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国科学技术大学
摘要:本发明公开一种提升辅助医疗决策系统安全性的方法、设备及介质,方法包括:步骤1,构建基于自注意力模型进行逆约束强化学习模型:采用因果屏蔽自注意力模型,以有患者的长历史状态序列的医疗专家数据和违背数据为输入,对患者的行动惩罚为输出,得到对医疗专家数据约束最小化,对违规数据约束最大化的成本函数梯度方程;步骤2,用成本函数学习约束策略:对步骤1的基于因果屏蔽自注意力的逆约束强化学习模型训练得到能观测长历史序列并能捕捉关键状态的成本函数,将成本函数用于医疗决策系统的现有约束强化学习算法对策略约束优化,得到安全的医疗决策系统。该方法在医疗场景下实现辅助医疗决策系统安全策略学习,提升辅助医疗决策系统安全性。
主权项:1.一种提升辅助医疗决策系统安全性的方法,其特征在于,包括:步骤1,获取医疗专家数据集和通过基于自注意力的生成模型生成违背数据集,所述医疗专家数据集与违背数据集均含有各患者的长历史状态序列;步骤2,构建基于因果屏蔽自注意力的逆约束强化学习模型:采用因果屏蔽自注意力模型,以步骤1获取的所述医疗专家数据集中的某患者的长历史状态序列的和步骤1生成的所述违背数据集中的某患者的长历史状态序列为输入,以对该患者的行动惩罚为输出,得到基于因果屏蔽自注意力的逆约束强化学习模型的优化目标方程,最小化目标方程即得到对医疗专家数据的约束最小化,对违背数据的约束最大化的成本函数的梯度方程,为: ;其中,表示基于因果屏蔽自注意力的逆约束强化学习模型的优化参数;表示以为参数的梯度算符;表示成本函数计算方程;表示取平均值;表示来自违背数据集的某患者的长历史状态序列;表示医疗专家数据集;表示对数函数;表示违背数据集的成本函数,即对患者的行动惩罚;表示来自医疗专家数据集的某患者的长历史状态序列;表示违背数据集;表示医疗专家数据的成本函数;步骤3,应用步骤2得出的成本函数学习约束策略:通过所述步骤2得到基于因果屏蔽自注意力的逆约束强化学习模型,对该基于因果屏蔽自注意力的逆约束强化学习模型进行训练得到一个能够观测患者的长历史状态序列并能够捕捉关键状态的成本函数,将该成本函数用于医疗决策系统的现有约束强化学习算法对策略进行约束优化,得到安全的医疗决策系统。
全文数据:
权利要求:
百度查询: 中国科学技术大学 提升辅助医疗决策系统安全性的方法、设备及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。