买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:湖北工业大学
摘要:本发明属于神经网络模型技术领域,公开了一种基于社区意识的图掩蔽自编码学习方法、系统及存储介质,所述基于社区意识的图掩蔽自编码学习方法将社区结构信息引入GAE框架,并在学习过程中保持社区的影响力;采用社区引导的边缘掩蔽和节点特征掩蔽;在自动编码器中使用GNN进行多任务解码,并辅以动态损失函数,从原始数据中提取额外的有价值信息,用于增强图重建;在节点分类、链接预测和图分类等多个下游任务上,ComMGAE在学习图表示时保留图拓扑结构和语义信息。本发明的目标是识别现有GAE设计的弱点,并在图表示学习中完善相关工作,以应用于下游任务,如链接预测以及节点或图分类。
主权项:1.一种基于社区意识的图掩蔽自编码学习方法,其特征在于,包括以下步骤:第一步,将社区结构信息引入GAE框架,并在学习过程中保持社区的影响力;采用社区引导的边缘掩蔽和节点特征掩蔽;第二步,在自动编码器中使用GNN进行多任务解码,并辅以动态损失函数,从原始数据中提取额外的有价值信息,用于增强图重建;第三步,在节点分类、链接预测和图分类多个下游任务上,ComMGAE在学习图表示时保留图拓扑结构和语义信息;在推荐系统中,用户和项目表示为图中的节点,他们的交互表示为边,用于学习用户和项目的表示,从而实现个性化的推荐;所述基于社区意识的图掩蔽自编码学习方法的ComMGAE模型由四个组件组成;掩码:通过社区检测得到的结果计算社区强度,并指导图的属性和结构进行遮蔽;编码:将掩码后的属性和图编码成低维向量;解码:包括属性解码和结构解码,属性解码器将编码后得到向量解码回到原始属性,结构解码器通过掩码后的图和属性信息解码原始图,都将编码器的输出作为输入;重构:将解码后的属性和结构与原始信息进行对比并计算损失,不断更新编码器和解码器直到能最大程度恢复出被掩码的信息;掩码模块,包括:社区检测,社区结构在图数据中普遍存在,社区检测算法评估节点组的聚类或划分程度,以及它们的内聚或分离倾向;选择模块度来评估社区划分的效果,定义如下: 其中,Ec是属于社区c的边的集合,η>0是分辨率参数,η越大,得到的社区越多,使用combo来检测社区,根据模块度来划分社区;社区连通强度,社区c的社区连通性强度Sc定义为: 由整个图中社区c的边的比例和社区c的度数的比例组成;图数据遮蔽,根据社区连通性来计算整个图的边权重和节点权重,如下所示:Wn=ΦnormXISc,τ, We=normIITSc,其中,normx=x-xminxmax-xmin是最大最小归一化操作,I是指示矩阵,如果则Ii,c=1,否则Ii,c=0,τ为节点遮蔽设置的阈值,遮蔽策略是按照伯努利分布从原始图中采样一部分边和节点 将从原始图中移除采样的边并使用剩余的边构造一个新的图同时,将采样的节点属性设置为零或用其他节点的属性覆盖它们,得到了遮蔽的节点属性遮蔽的图编码模块,包括:编码器,通过GNN网络将掩码的图结构和节点属性映射到包含更多压缩信息的低维表示,如下所示: 同时,编码器会使用多头注意力机制来捕获更多的语义信息;解码模块,包括:属性解码器,属性解码器试图将潜在代码映射回原始属性,其公式为: 选择了一个单层GNN作为属性解码器;结构解码器,结构解码器试图通过潜在特征Z重构掩码的边,使用链接预测作为执行边预测的代理任务,结构解码器也有多种类型可供选择,将结构解码器定义为: 其中MLP表示一个多层感知机;在对边进行随机采样后获得图中存在的正边集E+和图中没有的负边集E-,然后在学习到的节点特征Z中查找出每条边的节点对应的两个特征向量,将成对的特征输入到结构解码器中进行学习,学习到的结果将用于计算模型的损失;重构模块,包括:重构分为属性重构和结构重构,属性重构的学习目标是使重构的属性X′和原始属性X尽可能相似,选择改进的重构损失SCE作为损失函数,其公式为: 其中γ是训练缩放因素,为不同数据集调整不同的缩放大小,结构重构的学习目标如下: 其中E+和E-为采样到的正负边,v是边两端的节点,Z是编码器学习到的表征,模型总损失为: 其中α为重构调节参数,为了更好的整个训练过程中平衡结构信息和属性信息。
全文数据:
权利要求:
百度查询: 湖北工业大学 基于社区意识的图掩蔽自编码学习方法、系统及存储介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。