首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种论文主题无关引用检查方法及装置 

申请/专利权人:北京邮电大学;北京万方数据股份有限公司

申请日:2024-03-04

公开(公告)日:2024-06-04

公开(公告)号:CN117828513B

主分类号:G06F18/2433

分类号:G06F18/2433;G06F16/35;G06N3/0455;G06N3/0464;G06N3/0895;G06F16/901;G06N3/042;G06F18/213

优先权:

专利状态码:有效-授权

法律状态:2024.06.04#授权;2024.04.23#实质审查的生效;2024.04.05#公开

摘要:本申请提出了一种论文主题无关引用检查方法及装置,涉及计算机技术领域,其中,该方法包括:获取论文原始数据,并对论文原始数据进行解析,得到文本数据;对文本数据进行文本特征提取,得到文本数据的向量表示;基于文本数据和向量表示构建引文网络,其中,引文网络的节点为论文及其引文,边为节点之间的引用关系;对引文网络进行图异常检测,得到每个节点的综合异常分数,并基于设定的异常分数阈值确定检查结果,其中,图异常检测包括通过生成属性重建识别属性空间中的异常,通过多视图对比学习识别结构空间中的异常。采用上述方案的本申请能够实现对词语替换、句子重组等形式的句子相似性的快速、准确检测。

主权项:1.一种论文主题无关引用检查方法,其特征在于,包括以下步骤:获取论文原始数据,并对所述论文原始数据进行解析,得到文本数据;对所述文本数据进行文本特征提取,得到文本数据的向量表示;基于所述文本数据和向量表示构建引文网络,其中,所述引文网络的节点为论文及其引文,边为节点之间的引用关系;对所述引文网络进行图异常检测,得到每个节点的综合异常分数,并基于设定的异常分数阈值确定检查结果,其中,所述图异常检测包括通过生成属性重建识别属性空间中的异常,通过多视图对比学习识别结构空间中的异常;对所述引文网络中的目标节点进行图异常检测,得到目标节点的综合异常分数,包括:基于目标节点对所述引文网络进行图视图采样,得到目标节点的图视图,其中,所述图视图包括第一图视图和第二图视图,所述第一图视图和所述第二图视图通过采用不同的增强生成;基于目标节点的图视图,运用自监督学习的方式,通过生成属性重建模型确定每个图视图中目标节点的重构节点特征,并通过多视图对比学习模型确定目标节点与其图视图之间的对比辨别分数,其中,根据目标节点的特征向量以及与目标节点相关的两个图视图的节点特征向量和邻接矩阵生成节点的嵌入表示,并从图视图中生成图级嵌入标识,并将目标节点的嵌入表示与图级嵌入表示进行比较,生成正负样本对,并使用基于双线性变换的鉴别器来计算样本对的对比辨别分数;基于每个图视图中目标节点的原始节点特征和重构节点特征进行生成学习,确定第一异常评分,并基于所述目标节点与其图视图之间的对比辨别分数进行对比学习,确定第二异常评分,其中,所述第一异常评分为生成学习异常评分,所述生成学习异常评分为基于目标节点属性重建的异常评分,用于表示目标节点在属性空间中的异常程度,所述第二异常评分为对比学习异常评分,所述对比学习异常评分为基于目标节点与其周围上下文在嵌入和结构空间的差异的异常评分,用于表示目标节点在结构空间中的异常程度;对所述第一异常评分和所述第二异常评分进行加权组合,得到目标节点的综合异常分数;所述通过生成属性重建模型确定每个图视图中目标节点的重构节点特征,包括:通过GNN的编码器,基于每个图视图中目标节点的节点特征和邻接矩阵确定每个图视图中目标节点的节点嵌入矩阵;基于GNN的解码器,将每个图视图中目标节点的节点嵌入矩阵和对应的邻接矩阵分别输入,输出每个图视图中目标节点的重构节点特征;所述方法还包括:计算每个图形视图中目标节点的原始节点特征和重建节点特征之间的均方误差;通过所有图视图中目标节点的均方误差确定所述生成属性重建模型的目标函数。

全文数据:

权利要求:

百度查询: 北京邮电大学;北京万方数据股份有限公司 一种论文主题无关引用检查方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。