首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社团发现方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:浙江工业大学

摘要:一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社团发现方法,根据现有的哔哩哔哩用户数据构建属性网络G,将邻接矩阵和属性矩阵利用属性网络表征框架转化为嵌入向量H,对H运行k‑means算法,计算不同k值下、T次内最小的群内方差,计算I次内出现次数最多的最大和次大的曲率指标,得到对应的k值为ka、kb,分别运行IT次社团个数为ka和社团个数为kb的k‑means算法,并计算各自聚类结果最大的模块度Qa、Qb,取得Qa、Qb中较大值对应的k值作为社团划分的个数,最后利用k‑means聚类算法实现社团发现。本发明利用无参算法代替人工指定社团个数,降低了人为因素干扰,提高了社团发现的准确性和稳定性。

主权项:1.一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社区发现方法,其特征在于:所述方法包括如下步骤:步骤一:根据现有的哔哩哔哩数据,构建具有n个节点的用户网络模型G=V,E,F,V表示节点,E表示连边,F表示属性,每个用户为一个节点,用户与用户之间若有关注,则有连边,n个节点的连边关系组成一个邻接矩阵A,每个用户的浏览历史为节点的属性,共选取m个属性,所有节点的属性表示为一个n行m列的属性信息矩阵F;步骤二:采用属性网络表征学习方法将具有n个用户、m个属性的哔哩哔哩用户网络G转化为特征空间中n个d维嵌入向量H;步骤三:对得到的n个嵌入向量H运行k-means算法,聚类数目k取1到kmax各T次,分别计算不同k值下、T次内的群内方差Jk,把最小的记为Jkmin; Jkmin=argminJkt,1≤t≤T其中,Pj为社团j的节点集合,Xi为社团j内节点i的嵌入向量H,为社团j的各节点向量平均值,||x||2为求x的欧式距离的平方;步骤四:计算曲率指标rk; 步骤五:把最大的曲率指标rk对应的k记为k1,把次大的曲率指标rk对应的kk≠k1记为k2,以上步骤循环I次,把出现次数最多的k1和k2分别记为ka、kb;步骤六:分别运行社团个数为ka和社团个数为kb的k-means算法,并计算各自聚类结果的模块度Q1、Q2,模块度Q的公式为; 其中,c为社团序号,C为社团个数,lc是社团c的总边数,dc是社团c中所有用户的总度数,m为整个网络用户之间的总边数;步骤七:对步骤六循环执行IT次,对Q1、Q2分别取最大值记为Qa、Qb,对比得到最终的社团划分个数K; 步骤八:运行社团个数为K的k-means算法,返回哔哩哔哩用户的社团划分结果。

全文数据:

权利要求:

百度查询: 浙江工业大学 一种基于属性网络嵌入和无参聚类的哔哩哔哩用户社团发现方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。