首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于社交网络拓扑图的关联用户身份识别方法_武汉大学_202210429087.9 

申请/专利权人:武汉大学

申请日:2022-04-22

公开(公告)日:2024-06-11

公开(公告)号:CN114782209B

主分类号:G06Q50/00

分类号:G06Q50/00;G06F16/2458;G06F16/901

优先权:

专利状态码:有效-授权

法律状态:2024.06.11#授权;2022.08.09#实质审查的生效;2022.07.22#公开

摘要:目前的大多数方法都将社交网络嵌入到低维向量空间中,然后将用户对齐到低维空间中。然而,由于社会网络极其复杂和庞大,在网络嵌入过程中很容易受到不同邻居的误差传播和噪声的影响。基于此,本发明提供了一种基于社交网络拓扑图的关联用户身份识别方法,首先形成用户的ego网络即提取用户的一节邻居形成的局部网络,然后使用随机游走提取用户节点序列,接着使用自然语言模型框架学习用户的低维向量表示,最后训练矩阵将两个社交网络映射到相同的特征空间中进行对齐。本发明通过利用ego网络可以避免高阶邻居带来的干扰,因此可以提高节点嵌入结果,提升关联准确度。

主权项:1.一种基于社交网络拓扑图的关联用户身份识别方法,其特征在于,包括:S1:获取已知的两个社交网络数据集,其中,已知的社交网络数据集包括用户和用户之间的好友关系,两个社交网络数据集具有关联用户;S2:根据社交网络数据集中的用户以及好友关系分别构建社交网络G1和G2的拓扑图,其中,社交网络拓扑图中包括节点和连边,节点表示用户,连边表示具有好友关系;分别根据社交网络G1和G2形成每个节点的一阶ego网络,其中,G1网络中每个节点的一阶ego网络图组合形成一个ego拓扑图集合,G2网络中每个节点的一阶ego网络图组合形成一个ego拓扑图集合;S3:分别将两个社交网络G1和G2中每个节点的ego拓扑图集合依据每个节点的ego网络形成s个节点序列,其中,节点序列提取采用随机游走的方法,形成两个社交网络的节点序列集合;S4:利用skip-gram模型将形成的两个社交网络的节点序列集合分别映射成两个特征空间,并在映射的特征空间中学习节点的低维向量表示,得到每个节点的特征向量表示;S5:根据两个社交网络数据集的关联用户训练得到一个目标特征映射矩阵,将两个特征空间映射成同一个的特征空间,然后计算社交网络G1中的新节点与社交网络G2中每一个节点之间的相似度,并根据计算出的相似度,进行关联用户身份识别,其中,社交网络G1中的新节点为G1中的原有节点根据训练得到的目标特征映射矩阵进行映射后得到的节点;其中,步骤S5包括:S5.1:将步骤S1中两个社交数据集的关联用户作为映射依据,训练得到一个目标特征映射矩阵,基于目标特征映射矩阵将两个社交网络的向量空间映射到同一个特征空间中;S5.2:根据目标特征映射矩阵,将G1中的节点映射到G2,并得到对应的新节点,然后计算G1的每一个新节点与G2中的每个节点的相似度,根据计算出的相似度进行关联用户识别;步骤S5.1包括:采用S4得到的两个新的特征空间构建映射矩阵,通过最小化目标函数W*=argminY-XWTY-XW训练得到最终的目标映射矩阵W*=XTY-1XTY,其中,x、Y分别表示两个新的特征空间,W为映射矩阵,W*为目标映射矩阵;步骤S5.2包括:根据目标映射矩阵,将G1中的每一个节点映射到G2中,得到对应的新节点,计算方式为: 其中,u1为G1中的一个节点,为u1对应的新节点,即G1中的节点u1映射到G2中的映射节点;计算每一个新节点与社交网络G2中每个节点的余弦相似度: 其中,u′i为G2中的第i个节点,表示节点与u′i之间的相似度;通过比较与社交网络G2中每个节点的余弦相似度值,按照从大到小的顺序排序,按照顺序取前N个作为在社交网络G2中与社交网络G1中节点u1的关联匹配结果。

全文数据:

权利要求:

百度查询: 武汉大学 一种基于社交网络拓扑图的关联用户身份识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。