买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京邮电大学
摘要:本发明涉及自然语言处理技术领域,特别涉及一种中文电子病历手术操作文本的ICD自动编码方法及装置,该方法包括:以结构化电子病历中的手术操作文本作为输入,基于BERT无监督预训练模型,构建包含无监督上下文语义信息的节点与边,得到每条手术操作文本的无监督语义图;将构建的无监督语义图输入门控图神经网络,进行全局信息交互,得到上下文语义信息和全局语义信息融合的语义图;基于得到的语义信息融合的语义图,聚合各节点的表征,得到聚合的特征向量;根据聚合的特征向量进行分类,确定手术操作文本对应的ICD编码。本发明集成了手术操作文本中上下文语义信息和全局信息,能够基于文本本身取得更好的表征性能,实现对手术操作精准编码。
主权项:1.一种中文电子病历手术操作文本的ICD自动编码方法,其特征在于,包括:以结构化电子病历中的手术操作文本作为输入,基于BERT无监督预训练模型,构建包含无监督上下文语义信息的节点与边,得到每条手术操作文本的无监督语义图;其中,所述无监督语义图的节点包括章节级节点、文档级节点和最多四个轴心词节点;所述章节级节点的特征向量包含手术操作文本所属章节的上下文语义信息,所述文档级节点的特征向量包含整条手术操作文本的上下文语义信息,四个所述轴心词节点的特征向量分别包含手术操作的部位、术式、入路和疾病性质四个轴心词语义信息,所述无监督语义图的边的权重包含所连两节点之间在手术操作文本中的的语义影响力信息;将构建的所述无监督语义图输入门控图神经网络,进行全局信息交互,得到语义信息融合的语义图;基于得到的语义信息融合的语义图,聚合各节点的表征,得到聚合的特征向量;根据聚合的特征向量进行分类,确定所述手术操作文本对应的ICD编码;其中,所述基于BERT无监督预训练模型,构建包含无监督上下文语义信息的节点,包括:将所述手术操作文本输入第一BERT模型,查找所述手术操作文本对应的编码章节,确定章节标题文本;所述第一BERT模型包括BERT无监督预训练模型和softmax层;将所述章节标题文本输入第二BERT模型,以[CLS]字符的表征作为所述章节级节点的初始特征向量;将所述手术操作文本输入命名实体识别模型,分别提取部位、术式、入路和疾病性质四个轴心词的词组,确定各轴心词的词组位置;将所述手术操作文本输入第二BERT模型,以[CLS]字符的表征作为所述文档级节点的初始特征向量,分别以各轴心词词组所涉及字符的表征的平均值,作为相应轴心词节点的初始特征向量。
全文数据:
权利要求:
百度查询: 北京邮电大学 中文电子病历手术操作文本的ICD自动编码方法及装置
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。