买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:成都信息工程大学
摘要:本发明公开一种多特征语义融合的联合实体关系抽取方法、装置及介质,本发明引入了多特征语义融合模块,用于融合增强了实体间联系的实体掩码嵌入序列和提高了广度语义的包嵌入序列。随后,通过并行解码器一次性生成三元组集合嵌入,以提高三元组之间的交互和解码效率,然后使用FNN对三元组集合嵌入进行分类,并使用集合损失去指导模型训练,得到三元组集合。最后,采用实体掩码序列剪枝三元组集合。在公开数据集NYT和WebNLG上的实验结果表明,在编码器为Bert的情况下所提模型相较基线模型在准确率和F1指标上的效果更好,验证了本文模型的有效性。
主权项:1.一种多特征语义融合的联合实体关系抽取方法,其特征在于,所述方法包括:构建模型,所述模型包括句子编码器、多特征语义融合模块、并行解码器以及三元组生成模块;所述句子编码器用于根据给定句子进行编码,获取实体掩码嵌入、包嵌入和词向量嵌入;所述多特征语义融合模块包括:实体掩码生成器块,用于产生实体掩码序列;多特征语义融合块,用于将所述实体掩码嵌入、包嵌入和词向量嵌入进行融合得到多特征词嵌入;所述并行解码器用于根据所述多特征词嵌入和三元组查询以生成三元组集合嵌入;所述三元组生成模块包括:FNN,用于生成三元组集合,使用集合损失来指导所述模型生成三元组集合,在集合损失中使用贪心算法进行加快训练速度;实体掩码剪枝块,采用实体掩码序列进行剪枝,剪去主客实体识别错误的三元组,以筛选并行解码出来的三元组,输出的分布建模如下: ;其中,表示输出三元组集合,表示输入句子序列,表示在给定输入句子的条件下,输出三元组集合的预期数量n的概率,表示给定输入句子序列时,输出实体关系三元组集合的概率,n表示输出三元组集合的数量,表示给定输入句子序列时,预测输出下一个实体关系三元组集合的概率。
全文数据:
权利要求:
百度查询: 成都信息工程大学 多特征语义融合的联合实体关系抽取方法、装置及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。