首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种实体关系抽取方法、装置、电子设备及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:华南师范大学

摘要:本发明涉及一种实体关系抽取方法、装置、电子设备及存储介质。本发明的一种实体关系抽取方法包括:获取待抽取实体关系的文本;将所述文本输入BERT预训练模型,提取所述文本的句子特征,得到所述文本中每个位置的单词对应的隐藏向量;将所述隐藏向量输入实体识别层,得到所述文本中所有的实体和实体类型;将所述文本中的单词和所述文本中的实体进行连接得到的Token输入自注意力层,计算整个序列中Token的两两相似度,得到任意距离的长距离依赖性;将所述自注意力层的输出序列输入多叉解码树,解码得到所述文本的实体关系三元组。本发明的一种实体关系抽取方法,使用深度多叉解码树抽取关系三元组,可以有效的解决单实体多关系问题。

主权项:1.一种实体关系抽取方法,其特征在于,包括以下步骤:获取待抽取实体关系的文本;将所述文本输入BERT预训练模型,提取所述文本的句子特征,得到所述文本中每个位置的单词对应的隐藏向量;将所述隐藏向量输入实体识别层,得到所述文本中所有的实体和实体类型;将所述文本中的单词和所述文本中的实体进行连接得到的Token输入自注意力层,计算整个序列中Token的两两相似度,得到任意距离的长距离依赖性;将所述自注意力层的输出序列输入多叉解码树,解码得到所述文本的实体关系三元组;其中,所述实体识别层包括Span表示层和Span分类器;将所述隐藏向量输入实体识别层,得到所述文本中所有的实体和实体类型,包括:将所述隐藏向量输入所述Span表示层,得到标记序列S:=hi,hi+1,…,hi+k,其中,hi为所述文本中序号为i的单词对应的隐藏向量;使用融合函数g生成候选Span表达式Es:=ghi,hi+1,…,hi+k,其中,Es为候选Span,hi为所述文本中序号为i的单词对应的隐藏向量;在所述候选Span中添加关键词C,得到Span的最终表达Xs:=EsoC,其中Xs为Span的最终表达,o表示连接符号;将所述Span的最终表达输入到softmax分类器中,使用以下公式,得到每一个Span对应的实体类型得分:ECS=softmaxXs其中,ECS表示实体类型得分;将Span分类器输出的每一个Span对应的得分最高的实体类型,作为所述Span对应的实体类型;过滤掉none类型的Span,留下一组Spans构成实体,得到所述文本中所有的实体和实体类型;其中,所述多叉解码树包括第一实体解码层、关系解码层和第二实体解码层;将所述自注意力层的输出序列输入多叉解码树,解码得到所述文本的实体关系三元组,包括:将所述自注意力层的输出序列输入所述第一实体解码层,使用以下公式解码选择出第一实体:e1=Sighselfwe1+e1其中,we1为权重,be1为偏秩;hself为自注意力层的输出;将所述自注意力层的输出序列输入所述关系解码层,使用以下公式,得到关系预测可能性大小:Posibler=oftmaxhselfwr+br其中,wr为权重,br为偏秩;hself为自注意力层的输出;将所述自注意力层的输出序列输入所述第二实体解码层,使用以下公式,在整个序列上预测第一和关系R对应的第二实体:Posible2=oftmaxhselfwe2+e2其中,we2为权重,be2为偏秩;hself为自注意力层的输出;使用所述第一实体、关系R和对应的第二实体,得到所述文本的实体关系三元组。

全文数据:

权利要求:

百度查询: 华南师范大学 一种实体关系抽取方法、装置、电子设备及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术