首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于同义词网络和反向引用对比学习的ICD自动编码方法和装置 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:齐鲁工业大学(山东省科学院);山东第一医科大学第一附属医院(山东省千佛山医院)

摘要:本发明公开了基于同义词网络和反向引用对比学习的ICD自动编码方法和装置、存储介质、电子设备,属于自然语言处理技术领域及计算机人工智能领域,本发明要解决的技术问题为如何使用自然语言处理技术为患者的电子病历文本分配相应的ICD编码即疾病分类编码,从而减少医生的工作量,提高为电子病历文本分配ICD编码的速度,采用的技术方案为①基于同义词网络和反向引用对比学习的ICD自动编码方法,该方法包括如下步骤:S1、构建ICD自动编码模型训练数据集;S2、构建ICD自动编码模型;S3、构建对比学习模型;S4、训练ICD自动编码模型。②基于同义词网络和反向引用对比学习的ICD自动编码装置,该装置包括:ICD自动编码模型训练数据集构建单元、ICD自动编码模型构建单元、对比学习构建单元、ICD自动编码模型训练单元。

主权项:1.基于同义词网络和反向引用对比学习的ICD自动编码方法,其特征在于,该方法是通过构建数据预处理模块,并训练由文档表示模块、编码表示模块、多视角同义词匹配模块和预测模块组成的ICD自动编码模型,最终由正负样例选择模块、对比学习模块构成的对比学习单元约束模型的训练,以此在疾病表征层面区分相似疾病,以及缓解电子病历文本包含大量冗余信息的问题,并通过不同角度挖掘电子病历文本的信息,从而提高模型对电子病历文本的理解能力,以达到为电子病历文本更精确地分配ICD编码的目标,具体如下:S1、构建ICD自动编码模型训练数据集:对电子病历文本进行处理,将每个患者电子病历文本中出院小结部分与电子病历文本对应的ICD编码关联在一起构成一条训练数据;每一条电子病历文本会对应多种疾病,即被分配多个ICD编码,最终将所有的训练数据汇聚从而构建ICD自动编码模型训练数据集;其次每个ICD编码都对应着唯一的ICD编码描述文本,用于说明ICD编码所代表的疾病、症状或损伤,最终将全部ICD编码的描述文本作为匹配的标签;S2、构建ICD自动编码模型:由文档表示模块、编码表示模块、多视角同义词匹配模块和预测模块共同组成;S3、构建对比学习模型:由正负样例选择模块、对比学习模块共同组成;S4、训练ICD自动编码模型:在S1构建的ICD自动编码模型训练数据集上,通过S3构建的对比学习模型帮助S2构建的ICD自动编码模型进行训练。

全文数据:

权利要求:

百度查询: 齐鲁工业大学(山东省科学院) 山东第一医科大学第一附属医院(山东省千佛山医院) 基于同义词网络和反向引用对比学习的ICD自动编码方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。