首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种获取实体和实体关系的系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:生命奇点(北京)科技有限公司;奇点数联(北京)科技有限公司

摘要:本发明涉及一种获取实体和实体关系的系统,涉及文本处理技术领域,系统包括:处理器和存储有计算机程序的存储器,当计算机程序被处理器执行时,实现以下步骤:获取目标病历文本,获取目标病历文本对应的初始词列表,将初始词列表输入至预设模型中,获取目标词对列表和第一标签得分列表集,获取目标实体列表,获取第二标签得分列表集和第三标签得分列表集,获取目标病历文本对应的目标实体关系列表,本发明采用同一模型同时获取病历文本中的实体和实体关系,使得从病历文本中获取到的实体与实体关系的准确性较高,同时,将获取到的病历文本基于语义信息进行分词处理,加快模型的训练速度,提高了获取病历文本中实体和实体与实体之间关系的效率。

主权项:1.一种获取实体和实体关系的系统,其特征在于,所述系统包括:处理器和存储有计算机程序的存储器,当所述计算机程序被处理器执行时,实现以下步骤:S100,获取目标病历文本,其中,所述目标病历文本为待获取实体和实体关系的病历文本;S200,根据目标病历文本,获取目标病历文本对应的初始词列表A={A1,……,Ai,……,An},Ai为第i个初始词,i=1……n,n为初始词的数量,其中,所述初始词为通过jieba分词对目标病历文本进行分词处理获取到的词;S300,将A输入至预设模型中,获取目标词对列表B={B1,……,Be,……,Bf}和B对应的第一标签得分列表集D={D1,……,De,……,Df},De={De1,……,Dex,……,DeN},Be为第e个目标词对,e=1……f,f为目标词对的数量,Dex为Be对应的第一标签得分列表中的第x个第一标签得分,x=1……N,N为第一标签得分列表中第一标签得分的数量,所述第一标签得分为第一标签对应的得分,其中,所述第一标签为基于预设模型获取到的标注预设实体标签和EH-to-ET标签的标签,EH-to-ET代表同一实体的第一个token指向最后一个token,所述预设实体标签为预先设置的实体对应的标签,其中,所述实体对应的标签为表征用户身体状态的词对应的标签;S400,根据B和D,获取目标病历文本对应的目标实体列表,所述目标实体列表包括若干个目标实体,其中,在S400中通过如下步骤获取目标实体:S401,当De中存在Dex=1且De+1中全部D(e+1)x=0时,获取Be对应的实体为目标实体,其中,De+1为第e+1个目标词对应的第一标签得分列表,D(e+1)x为De+1中第x个第一标签得分;S403,当De中存在Dex=1且De+1中存在D(e+1)x=1时,获取Be+1对应的实体为目标实体;S500,获取第二标签得分列表集P={P1,……,Pu,……,PM}和第三标签得分列表集Q={Q1,……,Qu,……,QM},Pu={Pu1,……,Pue,……,Puf},Qu={Qu1,……,Que,……,Quf},其中,Pue为第u个预设实体关系标签对应的第二标签得分列表中Be对应的第二标签得分,Que为第u个预设实体关系标签对应的第三标签得分列表中Be对应的第三标签得分,u=1……M,M为预设实体关系标签的数量,所述预设实体关系标签为预先设置的实体与实体之间关系的标签,其中,所述实体与实体之间关系的标签为表征用户身体状态的词与词之间对应关系的标签,所述第二标签得分为第二标签对应的得分,所述第二标签为代表具有关系的实体对的一个实体的第一个token结合另一个实体的第一个token的标签,所述第三标签得分为第三标签对应的得分,所述第三标签为代表具有关系的实体对的一个实体的最后一个token结合另一个实体的最后一个token的标签;S600,根据目标实体列表、P和Q,获取目标病历文本对应的目标实体关系列表,其中,所述目标实体关系列表包括若干个目标实体关系,所述目标实体关系包括从目标实体列表中获取到的符合预设实体关系标签的两个目标实体以及此两个目标实体对应的预设实体关系标签,在S600中通过如下步骤获取目标实体关系:S601,获取目标实体关系标签ζ,其中,所述目标实体关系标签ζ为任一预设实体关系标签;S602,根据目标实体关系标签和P,获取第一目标词对列表,其中,所述第一目标词对列表包括若干个第一目标词对,所述第一目标词对为从B中获取到的满足目标实体关系标签对应的第三标签得分列表中不为零的第三标签得分对应的目标词对;S603,根据目标实体关系标签和Q,获取第二目标词对列表,其中,所述第二目标词对列表包括若干个第二目标词对,所述第二目标词对为从B中获取到的满足目标实体关系标签对应的第二标签得分列表中不为零的第二标签得分对应的目标词对;S604,根据第二目标词对列表和目标实体列表,获取候选实体对列表R={R1,……,Rv,……,Rd},Rv=(Rv1,Rv2),Rv为第v个候选实体对,Rv1为Rv中第一个候选实体,Rv2为Rv中第二个候选实体,v=1……d,d为候选实体对的数量,其中,当第二目标词对中的第一个第二目标词与目标实体列表中某一目标实体ω1对应的第一个词一致且第二目标词对中的第二个第二目标词与目标实体列表中某一目标实体ω2对应的第一个词一致时,获取(ω1,ω2)为一个候选实体对;S605,根据R,获取第三目标词对列表R0={R01,……,R0v,……,R0d},R0v=(R0v1,R0v2),R0v1为Rv1中的最后一个初始词,R0v2为Rv2中的最后一个初始词;S607,当R0v与第一目标词对列表中某一第一目标词对一致时,获取实体关系三元组{Rv1,ζ,Rv2}为一个目标实体关系。

全文数据:

权利要求:

百度查询: 生命奇点(北京)科技有限公司 奇点数联(北京)科技有限公司 一种获取实体和实体关系的系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。