一种融合中文医疗领域特征的医疗实体识别方法及系统

导航：龙图腾网> 最新专利技术> 一种融合中文医疗领域特征的医疗实体识别方法及系统

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：浙江工业大学

摘要：一种融合中文医疗领域特征的医疗实体识别方法，基于特定领域知识识别药品说明书中的实体，所述方法包括步骤：S1：收集中文药品说明书并进行文本预处理；S2：利用图卷积网络提取文本序列词级别的特征，其中节点的特征考虑了字音、字形以及字典的特征；S3:提取文本序列字级别的特征，并融合词级别的特征；S4:采用双向LSTM学习文本的序列特征，经过解码层得到汉字的序列标签，将标签进行组合，完成实体识别的任务。本发明充分全面地捕捉到汉字字音字形的特征，以词级别的粒度融入到实体识别的模型中，提高了医疗实体识别的精度。

主权项：1.一种融合中文医疗领域特征的医疗实体识别方法，其特征在于，包括如下步骤：S1：对中文药品说明书进行文本预处理操作，包括对说明书文本进行预清洗和文本的切分处理；S2：输入的句子通过中文语义分析工具得到语义依存关系，构造语义依存关系网络图，采用图卷积神经网络提取文本词级别的特征，其中输入图卷积神经网络的特征融合中文医疗领域字音、字形、字典的特征；具体包括：S2.1：输入的句子通过中文语义分析工具得到语义依存关系，构造语义依存关系网络图其中V表示的是句子中的词汇节点，E表示的是词汇之间的语义依存关系；所述的语义依存关系网络图中的词汇之间的语义依存关系，包括当事关系、受事关系、客事关系；S2.2：基于步骤S2.1构造的语义依存关系网络图，构建邻接矩阵采用以下公式对邻接矩阵进行卷积操作，对于输入图卷积神经网络的节点特征，融合了中文医疗领域字音、字形、字典的特征，字音通过拼音的声母、韵母、声调进行编码，字形通过汉字的部首信息和其余部分进行编码，医疗实体部首大多包含“月”、“疒”，相同的偏旁部首代表医疗实体中的一类实体，对部首进行单独的编码识别实体，字典信息根据医疗领域词典，采用N-gram语言模型描述医疗实体这类由字构成的词；1字音向量具体为：获取汉字的拼音，将拼音划分为声母、韵母、声调三个部分，通过拼音的声母、韵母、声调来编码汉字的拼音；2字形向量具体为：统计汉字的部首信息和获取汉字的笔画顺序信息，构建字典Dr和Ds，根据汉字的结构拆分成两个部分，通过两个部分对汉字的形状进行编码，如果有部分在部首字典Dr中，取该部首的one-hot编码Xsr，其余的部分按照笔画进行编码，任何一个汉字都由横、竖、撇、捺、折、点的线性组合表示，根据Ds，获取汉字剩余笔画的编码Xss；其中，concat·表示将括号中的向量进行拼接；3字典向量具体为：根据N-gram特征模板和医疗领域词典，获取字典向量；步骤S2.2所述的输入图卷积神经网络的节点特征表示为：聚合不同词汇之间的特征：其中，表示第l层图卷积操作输出的词汇节点的特征表示，Wl，bl表示网络学习的参数，σ·表示激活函数，D表示对应的度矩阵，IN表示单位矩阵；S3：采用预训练模型提取医疗文本字级别的特征；S4：采用基于双向LSTM和CRF的实体识别模型，输入特征融合步骤S2中的文本词级别特征和步骤S3中的文本字级别特征，实现药品说明书中的实体识别的任务。

全文数据：

权利要求：

百度查询：浙江工业大学一种融合中文医疗领域特征的医疗实体识别方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种磷酸铈钴锂改性类单晶富锂锰基正极材料的制备方法及其产物

下一篇：慢性低度炎症刺激形成衰老成纤维细胞模型的构建方法

相关技术

一种磷酸铈钴锂改性类单晶富锂锰基正极材料的制备方法及其产物

慢性低度炎症刺激形成衰老成纤维细胞模型的构建方法

一种基于重载群组列车群组通信的列车运行预测方法、系统及电子设备

一种铅碳电池用改性多孔炭的制备方法及铅碳电池

一种组合式固定件依附锁定器

一种养生保健酒

一种形貌可控的纳米硼化钴粉体及其制备方法

镭雕装置

一种双层基质与立体模式的茶树种质资源保存和快速繁育方法

一种鱼类产卵行为与生态水文指标响应关系量化方法

一种基于可逆热致变色微胶囊的复合绝缘材料及其制备方法

一种具有护针功能的旋梭及缝纫机

医疗相关技术

医疗注射系统_崧腾企业股份有限公司_202310261411.5

医疗注射系统_崧腾企业股份有限公司_202310260942.2

固定机构和医疗车_东软医疗系统股份有限公司_202323277581.7

无线医疗健康检测装置_重庆市科学技术研究院_202323467450.5

医疗器械清洗设备_潍坊京达铭医疗科技有限公司_202323500104.2

医疗服务方法和系统_北京京东拓先科技有限公司_202110469802.7

一种医疗箱_皖南医学院_202323028431.2

一种医疗护理用的医疗器械转运装置_哈尔滨医科大学_202420165425.7

一种医疗器械盒_派瑞格医疗器械(常州)有限公司_202323264999.4

一种医疗废物回收箱_黄姣_202410908743.2

特征相关技术

基于EEG敏感导联的特征选择和特征融合方法_北京工业大学_202211054620.4

基于特征选择与特征提取的情绪分类方法_西安理工大学_202410694393.4

生成特征向量和基于特征向量进行文本分类的方法和装置_北京京东尚科信息技术有限公司_201810034609.9

一种基于PCC提取负荷周期特征与时变趋势特征的精准短期负荷预测方法_郑州轻工业大学_202410678317.4

具有防短路特征部的钉仓_爱惜康有限责任公司_201980021220.3

特征评估方法、装置、电子设备及存储介质_北京达佳互联信息技术有限公司_202010642000.7

身体特征采集式心理测试装置_合肥霁宸教育科技有限公司_202420602809.0

一种基于机器学习的特征增强方法_内蒙古卫数数据科技有限公司_202310969773.X

具有曲面特征薄壁件的增材方法_苏州融速智造科技有限公司_202410751353.9

特征处理方法、装置、设备和存储介质_腾讯科技(深圳)有限公司_202410560941.4

领域相关技术

一种医疗领域中全量数据的差异比对方法和装置_杭州古珀医疗科技有限公司_202410835353.7

一种通用领域模型全景可视化方法与系统_中国电力科学研究院有限公司_201810485936.6

应用于锂电领域的石墨材料及其制备方法、应用_中国科学技术大学_202410884514.1

一种基于双目标推荐的领域自适应方法_宁波大学_202410650487.1

应用于超高压领域的密封圈及其制备方法_陕西创威科技有限公司_202410697375.1

一种领域本体的自动构建方法及系统_北京市科学技术研究院_202410733687.3

一种安全领域大模型微调方法、装置及可读储存介质_中国电子科技集团公司第三十研究所_202410931827.8

应用于网络安全领域的资产发现方法及系统_上海直画科技有限公司_202410736776.3

一种基于概念数据模型的领域代码生成方法及装置_浪潮通用软件有限公司_202010886403.6

基于领域自适应半监督学习的因果关系发现方法及系统_中国人民解放军国防科技大学_202410811544.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种融合中文医疗领域特征的医疗实体识别方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务