买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:哈尔滨工业大学
摘要:本发明提出了一种基于树形结构表示的评审者推荐方法,所述方法首先构建评审者树,根据数据本身所具有的层次逻辑结构,将信息组织成一棵树,并对树节点进行特征表示;再进行树形结构的特征提取,先通过聚类获取层级节点的相似信息,在通过构建局部感知重构模型获得层级节点对上级节点的补充信息,最后结果全局权重与局部权重结合孩子节点对上级节点进行重构,上述过程自底向上最后获得树形结构的特征表示;最后通过计算树形结构特征表示的相似度,进行评审者推荐。和现有方案相比,本发明获得了更好的推荐效果。
主权项:1.一种基于树形结构表示的评审者推荐方法,其特征在于:所述方法包括以下步骤:步骤A、生成评审者树:根据已有数据集属性与数据内在的层次关系,通过树形结构将不同的数据集组织起来;一位评审者的数据包括传记、所发表论文和论文引用参考文献,依据三种数据的特征信息的内在逻辑,构建“传记-论文-参考文献”三层评审者树;步骤B、基于树形结构特征表示进行评审者推荐:首先进行评审者树的特征表示,基于树形结构,提取层级节点的相似信息与局部差异信息对节点进行重构,自底向上进行信息融合,最终得到树形结构的特征表示;最后通过计算特征表示之间的余弦距离得到推荐结果;所述步骤A包括以下步骤:步骤A1、评审者树的构建:根据数据集本身所具有的层次逻辑结构,将数据组织成树形结构;评审者树的第一层根节点表示评审者的传记简介信息,所述传记简介信息包括评审者的教育经历、学术研究情况和工作职位信息,第二层每一个节点代表该评审者所写的一篇论文,第二层的节点总数代表评审者所发表的论文的总数,从第二层节点延伸出来的第三层节点表示该论文所引用的参考文献;步骤A2、节点特征提取:每个样本被表示为一棵树,对于一棵树由许多节点组成,每个节点包含了节点的索引信息,即该节点是这颗树的第几个节点、节点在树中所处的层数、节点的父亲节点的索引、节点的孩子节点的索引以及节点的属性特征;所述节点的属性特征为使用Bert模型获取的文本的Embedding表示;所述步骤B包括以下步骤:步骤B1、树形结构的特征表示:自倒数第二层向上对节点进行重构,直至达到顶层节点,此时重构后的根节点融合了下层孩子节点的信息,是最终的树形结构的特征表示;步骤B2、对重构后的根节点特征向量计算余弦距离,得到两位评审者的相似度,基于相似度进行评审者推荐;在步骤B1中,所述节点重构的过程具体为:步骤B11、使用K-means进行聚类,以该节点的所有孩子节点进行输入,获得c个聚簇中心,通过计算每个节点到其所属聚簇中心的距离与所属聚簇大小得到节点的全局判别信息权重,提取同层孩子节点相似信息;节点Ft与其所属聚簇中心Cj距离计算公式如下所示: 其中,m为特征的维度,fi表示节点特征在第i维的权重,Cj,i表示聚簇中心Cj在第i维的权重;最终的全局权重如下所示: 其中st为树的第t个孩子节点的全局判别信息的权重,Ni为第i个聚簇中心节点的个数;SFi,Ci为第i个节点于其所属簇中心之间的距离;Nj为st所属的第j个聚簇中心节点的个数,Ct表示第t个孩子节点所属聚簇的中心,c表示聚簇中心的个数,d表示属于当前聚簇中心的节点个数;步骤B12、建立局部感知重构模型,获取孩子节点对父亲节点的局部信息补充的权重,局部重构模型会有针对性的衡量一个孩子节点对父亲节点的信息补充能力,在信息补充的角度上,对父亲节点重构能力差的孩子节点,对父亲节点信息补充能力越强,具有更高的权重;步骤B13、结合全局判别权重与局部信息补充权重对孩子节点的属性进行加权,得到当前节点的局部属性;步骤B14、通过平衡系数调整局部属性的重要程度,将节点的局部属性与原始属性进行融合,从而得到节点最终的重构特征;重构特征生成的过程中涉及两个部分:1通过全局信息的提取和局部感知重构,得到孩子节点的局部属性;2通过平衡系数调整父节点属性和局部属性的权重,具体地由下式所示: 其中,为重构后的第l层的第i个节点的自身的属性向量,w∈[0,1]为平衡系数,是第t个孩子节点的局部感知权重,st是第t个孩子节点的全局判别信息权重,Di,lt表示是第i个节点的第t个孩子节点的属性信息,M为节点i的孩子节点的个数。
全文数据:
权利要求:
百度查询: 哈尔滨工业大学 一种基于树形结构表示的评审者推荐方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。