首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种使用Bert做疾病标准化映射分类的方法及系统_朱玮_202010627402.X 

申请/专利权人:朱玮

申请日:2020-07-02

公开(公告)日:2024-06-11

公开(公告)号:CN111785387B

主分类号:G16H50/70

分类号:G16H50/70;G06F16/35;G06F40/126;G06F40/284

优先权:

专利状态码:有效-授权

法律状态:2024.06.11#授权;2020.11.03#实质审查的生效;2020.10.16#公开

摘要:本发明公开了一种使用Bert做疾病标准化映射分类的方法及系统,所述方法包括:对获取的原始疾病诊断数据进行标注,将其映射到预设的标准规范上,以形成两个训练数据集;通过Bert对两个训练数据集进行学习训练以得到两层训练模型;通过两层训练模型分别对待处理的疾病诊断名称进行处理,以得到中间处理结果;再对中间处理结果进行排名处理,以得到最终排列的多个疾病标准名称;其效果是:通过形成的两个训练数据集为形成两层模型训练提供了可行性,能够对疾病诊断数据做标准化映射,使得医疗病案专家在对医院的疾病诊断名称做标准化映射时,可提高处理效率,同时对待处理的疾病诊断名称进行处理,也相应提高了最终映射的准确度。

主权项:1.一种使用Bert做疾病标准化映射分类的方法,其特征在于,所述方法包括:对获取的原始疾病诊断数据进行标注,并将其映射到预设的疾病标准规范名称和分类上,以形成两个训练数据集,包括标准疾病名称训练数据集和标准疾病分类训练数据集;其中,所述原始疾病诊断数据包括疾病诊断名称和编码;通过Bert对所述两个训练数据集进行学习训练以得到两层训练模型;通过所述两层训练模型分别对待处理的疾病诊断名称进行处理,以得到中间处理结果;对所述中间处理结果进行排名处理,以得到最终排列的多个疾病标准名称;通过Bert对所述两个训练数据集进行学习训练以得到两层训练模型,具体包括:使用Bert针对所述标准疾病名称训练数据集进行学习训练,获得疾病名称模型;使用Bert针对所述标准疾病分类训练数据集进行学习训练,获得疾病分类模型;通过所述两层训练模型分别对待处理的疾病诊断名称进行处理,以得到中间处理结果,具体包括:通过所述疾病名称模型为待处理的疾病诊断名称进行分类计算,以获得该疾病诊断名称数据所映射的疾病标准名称,并选取概率排名前n个疾病标准名称;通过所述疾病分类模型为待分类的疾病诊断名称进行分类,以获得该疾病诊断名称数据所映射的疾病标准分类,选取概率排名前m个疾病标准分类;所述n个疾病标准名称和m个疾病标准分类即为所述中间处理结果;对所述中间处理结果进行排名处理,以得到最终排列的多个疾病标准名称,具体包括:对n个疾病标准名称中的各元素计算其疾病名称权重值;对m个疾病标准分类中的各元素计算其疾病分类权重值;再根据所述疾病名称权重值和疾病分类权重值计算n个疾病标准名称中各元素的二次权重,并根据所述二次权重的大小进行排序,以得到所述最终排列;其中,疾病名称模型为小分类模型,疾病分类模型为大分类模型;使用大分类模型疾病分类模型预测获得的疾病分类值的集合C,再为集合C中每个元素Cj进行计算分类权重值,其中,Cj为集合C中第j个元素;使用小分类模型疾病名称模型预测的疾病名称的集合D,再为每个元素di计算名称权重值,其中,di为集合D中第i个元素;再为D计算每个元素的二次权重,其中,i、j的取值范围为1至10,为D中元素di所属C中分类Cj的分类权重值;如果di所属分类不在C中,则该di的分类权重值

全文数据:

权利要求:

百度查询: 朱玮 一种使用Bert做疾病标准化映射分类的方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。