首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于多源知识图谱的三元组可信评估方法 

申请/专利权人:东南大学

申请日:2020-12-10

公开(公告)日:2024-06-28

公开(公告)号:CN112507130B

主分类号:G06F16/36

分类号:G06F16/36

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2021.04.02#实质审查的生效;2021.03.16#公开

摘要:本发明公开了一种基于多源知识图谱的三元组可信评估方法,该方法包括步骤S1、对于给定的多源知识图谱,分别得到实体名称,实体类型,属性键值、关系名称的对应向量表示;同时得到多源知识图谱的属性值在嵌入空间下的向量表示;S2、在单个知识图谱内部对三元组的可信度进行评估;S3、对于多源知识图谱中单个知识图谱数据源的可信度评估;S4、对于多源知识图谱情况下共同空间中三元组的可信度评估,由单个知识图谱得到的可信度和多源知识图谱之间的互相影响共同决定,多源知识图谱之间的互相影响由不同数据源之间相互影响的三元组即交互三元组决定;S5、基于多源知识图谱可信评估的训练步骤。本发明的方法提高了三元组可信评估的精度。

主权项:1.一种基于多源知识图谱的三元组可信评估方法,其特征在于,该方法包括以下步骤:S1、对于给定的多源知识图谱,通过连续编号的方法,将多源知识图谱的实体名称,实体类型,属性键值、关系名称放入一个共通的空间下,分别得到实体名称,实体类型,属性键值、关系名称的对应向量表示;同时对多源知识图谱的属性值进行表示学习,并学习得到多源知识图谱的属性值在嵌入空间下的向量表示;S2、对于单个知识图谱内部三元组的可信度评估,利用知识图谱的内在特征,包括语义信息和图形信息,在单个知识图谱内部对三元组的可信度进行评估;将步骤S1得到的各种向量表示,通过打分函数,得到一个置于0与1之间的数值作为三元组的可信度;S3、对于多源知识图谱中单个知识图谱数据源的可信度评估,由数据源中所有三元组的可信度决定,同时单个知识图谱的可信度又会影响其内部三元组的可信度;所述的步骤S3具体如下:S301、单个知识图谱中三元组的可信度受到数据源的可信度影响,因此多源知识图谱情况下计算三元组可信度的公式为: 式中表示知识图谱G中的三元组t的可信度评分,t为三元组es,r,eo的简写表示,WG表示知识图谱G的可信度,表示受到知识图谱可信度影响情况下三元组t的可信度;S302、单个知识图谱数据源的可信度是由数据源中所有三元组的可信度决定的,在初始化各个知识图谱的可信度均赋值为1,随后由三元组决定,因此多源知识图谱情况下计算数据源可信度的公式为: 式中nG表示知识图谱G中所有三元组的数目,t∈G表示所有属于知识图谱G的三元组S4、对于多源知识图谱情况下共同空间中三元组的可信度评估,由步骤S2中单个知识图谱得到的可信度和多源知识图谱之间的互相影响共同决定,多源知识图谱之间的互相影响由不同数据源之间相互影响的三元组即交互三元组决定;所述的步骤S4中,不同数据源之间相互影响的三元组的影响方式具体如下:三种不同的交互方法被利用对三元组的影响方式进行建模,其分别从属性值层次、语义对齐层次和图邻居层次对交互进行建模:S401、属性值交互式三元组;同一个真实世界的两个实体具有的属性相似性更高,能够彼此相互影响,属性值交互式三元组的评分方式,具体如下:属性值交互定义为三元组实体间的属性值交互,因此属性值交互评分的计算公式为: 其中ITEvalue·表示求解三元组之间的属性值交互评分函数,|·|表示求解集合内元素数量的计数函数,p·表示一个实体的属性值集合,c·,·表示实体之间共有属性值的集合;S402、语义对齐交互式三元组;在嵌入空间中,语义对齐的实体或关系是紧密关联的,能够彼此相互影响,嵌入空间中,语义对齐的实体对之间的距离计算方式具体如下:知识图谱G1的三元组和知识图谱G2的三元组是语义对齐式交互的,那么在嵌入空间中,这组对应三元组至少有一个实体或关系是紧密的,同时,交互式三元组还要求对应三元组在非交互式的部分上的距离不大于阈值,因此距离交互评分的计算公式为: 式中ITEalignment·表示求解三元组之间的语义对齐交互函数,‖‖表示实体对或关系对在嵌入空间上的L2距离;S403、图邻居交互式三元组;根据语义对齐相似性研究,共享相似环境的实体具有语义相似性的可能性更高,能够彼此相互影响:相似环境下的实体之间距离计算方式具体如下:通过评估头实体和尾实体的周围环境,分析三元组对之间的邻居交互关系,因此图邻居交互评分的计算公式为: 式中ITEneighbor·表示求解三元组之间的图邻居交互评分函数,N·表示实体邻居的在嵌入空间上的均值;S404、交互式三元组的影响方式;如果不同知识图谱中的三元组是交互式的,那么它们将相互影响;判定一组三元组属于交互三元组需要任一交互评分小于阈值,因此其计算公式为: 式中I·,·表示计算两个三元组是否为交互三元组的函数,是为1,否为0,1·表示条件真时为1否则为0的判断函数,θvalue表示属性值交互评分的阈值,θalignment表示语义对齐交互评分的阈值,θneighbour表示图邻居交互评分的阈值;交互式三元组的影响方式具体如下:如果三元组的可信度接近,即可信度差值低于临界值,三元组的可信度会逐渐接近,两个交互中的三元组的可信度差值大于一个临界值时,这对三元组的可信度分数都应该被降低,为了在表征学习的训练中利用这些信息,通过实施以下定制设计的损失来建模,因此其计算公式为, 式中Ri,j表示计算交互三元组可信度损失的函数,其中i在G1中,j在G2中,且i和j为交互三元组,Intth为差异控制阈值,如果两个三元组不是交互三元组,则不需要考虑该项损失;S5、基于多源知识图谱可信评估的训练步骤;所述的步骤S5中,基于多源知识图谱可信评估的训练步骤具体如下:S501、在多源知识图谱中各个图谱内部,需要计算可信评估正例三元组和据其负采样得到的负例三元组之间可信度间隔的损失,S表示所有知识图谱的集合,对于所有的知识图谱G∈S,对G中任一个正例三元组t+,可信度评估标签为1进行负采样,随机替换其头实体或者尾实体,得到负例三元组t-,预期可信度评估标签为0,其可信评估结果分别为和因此具体的损失计算公式为: 式中Lrel代表多源知识图谱中各个图谱内部三元组负采样的损失,max·,·表示取函数内较大数值的函数,γ代表正例三元组和负例三元组可信评估结果的间隔,ct代表针对正例三元组t+进行负采样得到的负例三元组t-的集合;S502、在多源知识图谱中各个图谱之间,需要计算交互三元组交互影响的损失,故需要计算所有交互三元组的交互影响损失,因此其计算公式为: 式中Lint代表所有交互三元组的交互影响损失,In代表所有交互三元组的集合;S503、为了融合以上两种损失函数得到模型训练的总损失L,引入超参数β调节多源知识图谱中各个图谱内部三元组负采样的损失Lrel和所有交互三元组的交互影响损失Lint,同时为了避免过拟合,需要加上正则化项,因此计算公式为: 式中Ω代表所有参数的集合,W代表模型中的任一参数,‖·‖2代表L2正则函数;S504、计算得到损失后,根据损失进行反向传播,更新模型参数,重新进行评估直到模型收敛。

全文数据:

权利要求:

百度查询: 东南大学 一种基于多源知识图谱的三元组可信评估方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。