首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于邻居节点选择与特征汇聚的实体消歧方法和系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:湖南大学

摘要:本发明公开了一种基于邻居节点选择与特征汇聚的实体消歧方法,其从两个方面提升实体消歧的效果,一方面利用BERT预训练词向量模型对实体本身信息与其属性进行编码,因为属性信息本身是区分实体“一词多义”和“多词同义”直接有效的信息,同时也更好的关注了实体节点本身特征;另一方面,对于利用实体本身信息无法进行消歧的实体,此时利用与待消歧实体有关联的邻居实体信息进行辅助判断,通过邻居节点采样与特征汇聚形成了带邻居实体信息的待消歧节点信息,提升了实体消歧的准确性,同时解决了传统基于深度学习和基于图的实体消歧方法效率不高的问题。

主权项:1.一种基于邻居节点选择与特征汇聚的实体消歧方法,其特征在于,包括如下步骤:1从知识图谱获取多个待消歧实体,使用正则表达式对每个待消歧实体的名称与待消歧实体的属性进行清洗,以获取处理后的待消歧实体,使用BERT预训练词向量模型将处理后的待消歧实体的名称转换成名称的特征向量,并将处理后的待消歧实体的每个属性转换成属性的特征向量,得到的名称的特征向量、以及所有属性的特征向量共同构成待消歧实体的特征向量矩阵。2针对每个待消歧实体而言,对步骤1得到的该待消歧实体的特征向量矩阵中所有的属性的特征向量进行融合,以得到该待消歧实体合并后的特征向量;3利用类余弦函数对步骤2得到的所有待消歧实体合并后的特征向量进行相似度计算,以得到两两待消歧实体之间的背景相似度。4针对步骤3得到的每两两待消歧实体之间的背景相似度而言,判断该背景相似度是否大于预设阈值,如果是则说明这两个待消歧实体为同一实体,过程结束,否则进入步骤5;5获取知识图谱中每个待消歧实体的第一层邻居节点列表。6针对知识图谱中每个待消歧实体而言,对步骤5得到的该待消歧实体的第一层邻居节点列表进行邻居节点选择,以得到该待消歧实体的第二层邻居节点列表:7针对知识图谱中每个待消歧实体而言,对步骤5得到的待消歧实体的第一层邻居节点列表和步骤6得到的待消歧实体的第二层邻居节点列表中的每一个节点而言,为该节点构建特征向量矩阵,从而得到该待消歧实体的第一层邻居节点列表对应的特征向量矩阵、以及第二层邻居节点列表对应的特征向量矩阵。8针对知识图谱中的每一个待消歧实体而言,将步骤1得到的该待消歧实体的特征向量矩阵、步骤7得到的该待消歧实体的第一层邻居节点列表对应的特征向量矩阵、以及第二层邻居节点列表对应的特征向量矩阵进行融合,以得到该待消歧实体的融合特征向量。9针对知识图谱中的所有待消歧实体而言,根据步骤8得到的所有待消歧实体的融合特征向量、并利用类余弦函数获取两两待消歧实体之间的背景相似度。10判断步骤9得到的背景相似度是否大于指定阈值,若大于则说明两个待消歧实体为同一实体,过程结束,否则说明两个待消歧实体为不同实体,过程结束。

全文数据:

权利要求:

百度查询: 湖南大学 一种基于邻居节点选择与特征汇聚的实体消歧方法和系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。