首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于先验知识的实体关系抽取方法、装置及存储介质 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:厦门渊亭信息科技有限公司

摘要:本发明提供了一种基于先验知识的实体关系抽取方法、装置及存储介质,该方法包括:S1,获取行业领域的先验知识;S2,根据先验知识自动生成训练命名实体识别模型以及实体关系抽取模型所需的训练数据;S3,使用深度学习方法将先验知识融合到预训练模型,构建能实现实体关系过滤的关系抽取模型;S4,训练命名实体识别模型;S5,训练能实现关系过滤的关系抽取模型;S6,使用经训练的命名实体模型和经训练的关系抽取模型,采用Pipeline方式对文本进行实体识别和实体间关系的抽取。利用该技术方案,通过使用先验知识与预训练模型融合构建能关系过滤的实体关系抽取模型,加快了实体关系抽取的训练速度和推理速度,显著提升了模型的准确率。

主权项:1.一种基于先验知识的实体关系抽取方法,其特征在于,包括:S1,获取选定行业领域的资源,所述资源包括领域先验知识、关系类型以及语料库,其中,所述领域先验知识包括知识图谱或结构化三元组数据,所述结构化三元组数据包括头实体、尾实体和头实体与尾实体之间的实体关系;S2,使用预先设定的规则,根据所述知识图谱或结构化三元组数据自动生成训练命名实体识别模型所需的BIO标注数据和训练实体关系抽取模型所需的SPO标注数据;S3,使用深度学习方法将所述领域先验知识融合到选定的预训练模型,根据所述知识图谱或结构化三元组数据和所述预训练模型构建能实现实体间关系过滤的实体关系抽取模型;S4,使用所述生成的BIO标注数据来训练所述命名实体识别模型;S5,使用所述生成的SPO标注数据来训练所述能实现实体间关系过滤的实体关系抽取模型;S6,使用经过训练的所述命名实体识别模型和经过训练的所述实体关系抽取模型,采用Pipeline的方式对文本进行实体识别和实体间关系的抽取;其中,所述步骤S3中所述选定的预训练模型包括BERT结构和预先选定的KGE模型,所述步骤S3中构建能实现关系过滤的关系抽取模型包括:通过所述KGE模型获取所述领域先验知识中实体及实体关系的embedding;根据所述实体及实体关系的embedding修改所述预训练模型的Bert结构,并结合所述修改后的Bert结构和所述实体及实体关系的embedding获得所述实体关系抽取模型;其中,所述关系抽取模型实现的关系过滤包括:将从待进行实体关系抽取的文本中获取的实体中存在不合理的实体关系的实体对、三元组或实体组合过滤掉,其中通过计算待判断的实体及实体关系与所述领域先验知识中已知的实体及实体关系之间的相似度并将所述相似度与预先设定的相似度阈值进行比较来确定待判断的实体之间是否存在不合理的实体关系,其中,当所述相似度小于预定的相似度阈值时确定所述待判断的实体之间存在不合理的实体关系。

全文数据:

权利要求:

百度查询: 厦门渊亭信息科技有限公司 基于先验知识的实体关系抽取方法、装置及存储介质

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。