首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

面向论文网络数据的自适应图卷积聚类方法 

申请/专利权人:北京工业大学

申请日:2021-09-27

公开(公告)日:2024-05-28

公开(公告)号:CN113869404B

主分类号:G06F18/23

分类号:G06F18/23;G06F18/25;G06F18/22;G06N3/0464;G06N3/042;G06N3/0455;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.05.28#授权;2022.01.21#实质审查的生效;2021.12.31#公开

摘要:面向论文网络数据的自适应图卷积聚类方法适用于数据挖掘领域。该方法首次将自适应图卷积网络应用到深度图卷积聚类任务中,自适应的更新图结构并学习最优的数据表示;其次,该方法创造性地提出了一个基于注意力机制的融合模块,逐层加权融合两个并行网络的数据表示,同时有效缓解了图卷积网络的过平滑的问题。该方法的提出,主要解决的技术问题包括所有样本之间内在结构的挖掘,确保模型能够捕获更完整的数据结构信息,避免不准确的图结构对聚类性能产生的负影响,以及异构信息的有效融合。

主权项:1.面向论文网络数据的自适应图卷积聚类方法,其特征在于:1首先利用自编码器从输入数据中提取属性信息,Hl=σWlHl-1+bl,l=1,2,…,L其中Hl表示自编码器第l层学习到的数据表示,Wl和bl分别表示可学习的第l层的权重矩阵和偏差,L表示模型的网络层数,σ·表示非线性激活函数,选择RELU作为激活函数;同时,为了尽可能地保留原始数据的特征,最小化重构数据和原始输入数据X之间的重构误差,X表示数据集中样本的关键词的词袋特征; 其中,N是样本的个数,定义Frobenius范数为2通过自适应图卷积模块来捕获数据的高阶结构信息;Zl+1=σAl+1FlUl+1,l=1,2,…,L其中,Ul+1表示自适应图卷积模块第l+1层的可学习的权重矩阵,Zl+1是该模块第l+1层更新的节点表示,Al+1是学习到的自适应图结构,Fl是从基于注意力机制的融合模块获取的融合表示;具体的,通过计算融合表示Fl的内积来构造邻接矩阵,挖掘样本之间的潜在相似性, 然后,将学习到的自适应图加到标准化后的原始图结构上来增强原始图结构的质量, 其中,∈是平衡系数,设置∈为0.5;最后,为了使学习到的中间层数据表示ZL2更能反映数据之间的依赖关系,最小化重构图结构和原始图结构A之间的重构误差, 其中,是由自适应图卷积模块最后一层的数据表示ZL的内积构建的邻接矩阵;3提出基于注意力机制的融合模块来高效的融合自编码器模块和自适应图卷积模块提取到的数据表示;具体的,对于网络的第l层,级联分别从自编码模块和自适应图卷积模块学习到的数据表示Hl和Zl,Yl=[Hl,Zl],其中[·]是级联运算;由级联特征Yl,根据Hl和Zl的相对重要性分别为它们分配不同的权重,最后得到融合表示Fl,a=fYle=softmaxsigmoidaτW=meaneFl=W1·Zl+W2·Hl,其中,W1是分配给Zl的权重系数,W2是分配给Hl的权重系数,f·是由三层全连接层组成的网络,τ是校准系数,设置τ为10;4引用自监督聚类模块来训练端到端的模型; 其中,qij表示在自编码器学习到的中间层特征表示HL2中将第i个样本分配给第j个簇的概率,通过放大qij并将其标准化计算得到目标分布pij;tij表示在自适应图卷积模块中学习到的中间层特征表示ZL2中第i个样本分配给第j个簇的概率;最后,提出的总体目标函数为: 其中λ1,λ2和λ3是平衡不同损失重要性的超参数,分别取1.0,0.01,0.1;随机初始化模型中的权重和偏差,包括Wl,bl和Ul+1,通过最小化损失函数对该模型进行优化求解,学习模型中的权重和偏差参数,当模型的训练次数达到700次时或损失函数的值在±1%之间波动时,得到最优的数据表示ZL2,然后将它送入到softmax函数来得到最终的聚类结果C*,C*=softmaxZL2。

全文数据:

权利要求:

百度查询: 北京工业大学 面向论文网络数据的自适应图卷积聚类方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。