首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于字词读音融合特征模型的电子病历命名实体识别方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京化工大学

摘要:本发明公开了基于字词读音融合特征模型的电子病历命名实体识别方法,包括以下步骤:生成待识别命名实体的电子病历的字符序列对应的字符的字词向量的集合;生成字符序列对应的读音向量;将读音向量输入到第一神经网络进行处理,得到字符序列对应的读音加强字词向量;将读音加强字词向量经过词频权重和读音权重处理融合生成字词读音特征模型;将字词读音特征模型输入到第二神经网络中进行处理,得到电子病历的命名实体识别结果;本发明具备迁移性,降低了模型构建的复杂工作程度,对于标注数据较少的领域进行命名实体识别任务,具有良好的电子病历的命名实体识别效果。

主权项:1.基于字词读音融合特征模型的电子病历命名实体识别方法,其特征在于,包括以下步骤:生成待识别命名实体的电子病历的字符序列对应的字符的字词向量的集合;生成所述字符序列对应的读音向量;将所述读音向量输入到第一神经网络进行处理,得到所述字符序列对应的读音加强字词向量;将读音加强字词向量经过词频权重和读音权重处理融合生成字词读音特征模型;将所述字词读音特征模型输入到第二神经网络中进行处理,得到所述电子病历的命名实体识别结果;所述字词向量的集合为BMES集合,通过Soft-lexicon构造模型生成,生成“B”、“M”、“E”、“S”四个词集,并且BMES集合中的字词向量表示如下:eB,M,E,S=[vB+vM+vE+vS]其中:“B”集合保存当前字为词首字的单词列表;“M”集合保存当前字为词中间字的单词列表,“E”集合保存当前字为词尾字的单词列表,“S”集合保存当前字为单独字成词的单词列表;所述读音加强字词向量的表示向量如下:xc←[xc;eB*,M*,E*,S*]其中:*表示字词向量经过读音向量加强表示;再者,设置词频权重为α,读音权重为β;而词频权重和读音权重的处理融合如下述公式所示:weightw=Softmaxα·frequencyw*β·pronunciationw;α,β∈[0,1],α+β=1。

全文数据:

权利要求:

百度查询: 北京化工大学 基于字词读音融合特征模型的电子病历命名实体识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。