买专利,只认龙图腾
首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】SubGNN注入空间特征的地理知识图谱表示学习方法_南京师范大学_202410156606.8 

申请/专利权人:南京师范大学

申请日:2024-02-04

公开(公告)日:2024-04-26

公开(公告)号:CN117688121B

主分类号:G06F16/29

分类号:G06F16/29;G06F16/28;G06N3/042

优先权:

专利状态码:有效-授权

法律状态:2024.04.26#授权;2024.03.29#实质审查的生效;2024.03.12#公开

摘要:本发明公开了一种SubGNN注入空间特征的地理知识图谱表示学习方法,包括通过地理实体的唯一标识符,链接地理实体的空间数据,将点、线和面地理实体统一表达为无向图中的子图;采用子图神经网络进行位置、邻居、结构空间信息特征编码,获得地理实体基于空间特征的向量表示;结合图谱本身结构的向量表示,改进融合地理空间特征向量的能量函数,在平移模型的框架下进行学习,最终得到融合空间特征的知识图谱向量表示。本申请设计了一种注入地理空间特征的知识表示学习模型,提升了地理空间知识向量表示的准确性,提高了地理知识链接预测任务的性能,从而更好服务于地理空间知识图谱的知识补全和知识推理等应用。

主权项:1.一种SubGNN注入空间特征的地理知识图谱表示学习方法,其特征在于,所述方法包括如下步骤:S1:抓取地理空间知识图谱中地理实体的矢量数据,作为获得地理实体的空间特征向量表示的基础数据;S2:设计一种在统一的空间中将点、线和面实体一致表达且保持实体空间特征完整的映射方法,将点、线和面实体统一表达为子图的形式;S3:提出基于子图神经网络的地理空间特征编码器,结合地理实体的位置、邻居与结构特征,获得地理实体基于空间特征的向量表示;S4:基于平移模型,设计融合地理实体空间特征向量的能量函数,将基于地理实体的空间特征和基于图谱本身结构特征的两种向量表示学习到同一个连续向量空间;所述步骤S1中,获取地理空间知识图谱中地理实体的矢量数据,具体是指通过地理实体唯一标识符从OpenStreetMap中链接地理实体的几何坐标信息,所述步骤S2中,设计一种在统一的空间中将点、线和面实体一致表达且保持实体空间特征完整的映射方法,将点、线和面实体统一表达为子图的形式,具体是指通过将原本矢量的数据,转化为节点与边的图结构形式,其中点实体通过无向图结构化后将为单个节点组成的子图,线实体通过图结构化后将为多个节点与边相连形成的子图,面实体通过图结构化后将为首尾相连的多个节点所包围的所有节点和边组合而成的子图;所述步骤S3中子图神经网络空间特征编码器具体是指,挖掘图结构上子图内部与子图间的位置、邻居和结构3种空间特征,通过空间特征消息传递框架,在每个空间特征通道中设置采样点,捕获的空间特性从采样点出发,并由特定的相似性函数加权,传播到子图,最终训练得到子图的向量表示,即获得地理实体基于空间特征的向量表示,每一种空间特征的传递函数与相似性函数定义如下: γNES,ANE=1 其中下标X代表的空间特征通道,包括位置通道PO、邻居通道NE和结构通道ST;S代表子图集合,Ax是X空间特征通道的采样点,ax是X空间特征通道采样点通过编码生成的向量,代表X空间特征通道的传递函数;γx代表X空间特征通道的传递函数,其中位置通道特性通过子图到采样点的最短路径反映,dsp代表子图到采样点的平均的最短距离;邻居通道相似度设定为1;结构通道特性通过子图与采样点有序度序列反映,dS和分别代表子图和采样点的有序度序列,DTW代表动态时间规整函数,将空间特征的消息转换为顺序不变的隐藏表示和属性感知的向量表示,如下: zx=σMx·yx其中gx是聚合X空间特征通道中所有采样点的空间特性消息的隐藏表示,AGGM是对消息进行操作的聚合函数,NA代表X空间特征通道中采样点的数量,i为空间特性的传递函数序号,yx表示关于X空间特征通道的子图表示,其携带了空间特性消息的隐藏表示gx和前一层的表示的特性,l代表网络层,Wx是X空间特征通道的逐层可学习的权重矩阵,σ是非线性激活函数,zx为属性感知的向量表示,Mx是采样点的消息矩阵,由消息传递函数MSGx生成,最终聚合不同空间特征通道和不同网络层的子图表示,转化为最终的子图表示: esp=ys=AGGL{z0,...,zl,...,zL}其中zl代表第l层的属性感知向量,AGGC表示通道聚合函数,AGGL表示网络层聚合函数,yS表示子图的最终表示,也即地理实体基于空间特征的向量表示esp;所述步骤S4中,平移模型中,三元组内部实体与关系向量之间具有h+r≈t的关系,其中的h是头实体的向量表示,r是关系的向量表示,t是尾实体的向量表示,用eh,t统一表示实体的向量表示,能量函数E为:Eh,r,t=||hst+r-tst||其中hst,tst是仅基于图谱本身的结构信息的头实体和尾实体向量表示,融合地理实体基于空间特征的向量表示,设计的能量函数为:Eh,r,t=α1||hst+r-tst||+α2||hst+r-tsp||+α3||hsp+r-tst||+α4||hsp+r-tsp||其中α1,α2,α3,α4是控制各项权值的超参数,hsp,tsp是基于空间特征的头实体和尾实体的向量表示,||hst+r-tst||部分实际上与平移模型中的能量函数一致,||hst+r-tsp||,||hsp+r-tst||和||hsp+r-tsp||是加入了基于空间特征的实体向量影响的混合项,通过混合项的限制,将实体的两种向量映射到同一语义空间,共享相同的关系向量,最终将获得实体的向量表示eh,t,关系的向量表示r。

全文数据:

权利要求:

百度查询: 南京师范大学 SubGNN注入空间特征的地理知识图谱表示学习方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。