首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法 

申请/专利权人:湖北第二师范学院

申请日:2020-12-24

公开(公告)日:2024-04-09

公开(公告)号:CN112667876B

主分类号:G06F18/23213

分类号:G06F18/23213;G06N3/006;G06F16/951;G06Q50/00

优先权:

专利状态码:有效-授权

法律状态:2024.04.09#授权;2021.05.04#实质审查的生效;2021.04.16#公开

摘要:本发明公开了一种基于PSOTVCF‑Kmeans算法的意见领袖群识别方法,包括:步骤1,利用网络爬虫工具,从互联网中采集实际的社交网络数据;步骤2,基于“用户影响力”和“话题影响力”计算意见领袖值;所述用户影响力包括粉丝量、原创微博量和是否认证,话题影响力包括博文评论量、转发量和点赞量;步骤3,依意见领袖值高低排序得到预判的意见领袖群簇P和普通用户群簇Q,作为粒子群的初始扰动场,基于PSOTVCF‑Kmeans算法对意见领袖群簇P和普通用户群簇Q进行聚类。本文利用时变双重压缩因子粒子群优化算法,建立PSOTVCF‑KMeans聚类模型,通过PSOTVCF寻找全局最优解的优势,确定最佳聚类初始簇心,提高了K‑means算法的聚类效果和效率。

主权项:1.一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法,其特征在于,包括如下步骤:步骤1,利用网络爬虫工具,从互联网中采集实际的社交网络数据;步骤2,基于“用户影响力”和“话题影响力”计算意见领袖值;所述用户影响力包括粉丝量、原创微博量和是否认证,话题影响力包括博文评论量、转发量和点赞量;步骤2中意见领袖值的计算公式如下,I=w1*F1+w2F2+w3F33.1T=w4*F4+w5F5+w6F63.2L=I+T3.3其中,公式3.1为用户影响力计算公式,其中,w1,w2和w3代表不同指标的权重,F1、为用户的粉丝量,F2为原创微博量,F3表示是否认证,若已认证,则F3=1,若未认证,则F3=0;公式3.2为话题影响力计算公式,w4,w5和w6代表不同指标的权重,F4,F5和F6分别代表评论量、转发量和点赞量;公式3.3为用户最终的意见领袖值;步骤3,依意见领袖值高低排序得到预判的意见领袖群簇P和普通用户群簇Q,作为粒子群的初始扰动场,基于PSOTVCF-Kmeans算法对意见领袖群簇P和普通用户群簇Q进行聚类,具体实现方式如下,1粒子种群初始扰动:首先随机在簇P和簇Q中选取一个初始聚类簇心,然后依据最大距离原则选取剩余的聚类簇心,重复操作n次,产生n个粒子,计算每个初始簇心与所在簇其他节点的距离;2计算n个粒子的适应度值fit,并寻找每个粒子的个体极值pbest和群体极值gbest;3更新粒子的速度与位置;计算公式如下, 得到系统矩阵: 时变压缩因子计算公式为: 其中,压缩因子χ是一个正实数,ITER为当前进化代数,MAXITER为最大迭代数,C1N和C1M分别为第一个加速因子的初始最大值和最小值,C2N和C2M分别为第二个加速因子的初始最大值和最小值;4以更新后的粒子为聚类中心重新聚类,并计算每个粒子的适应度值;5判断当前种群适应度方差Var是否低于某个阈值Thre或者达到最大迭代次数,如果是,则转向6;否则转向3;5中适应度方差Var的计算公式如下; 其中,fi是指第i代的fit值;favg是fit值的平均值;6以PSOTVCF算法得到的簇P和簇Q的最佳位置[pbest,qbest]作为初始中心,令K-means当前迭代次数为t=0;7对每个数据,分别计算其与当前迭代的簇P和簇Q的簇心Cj1,Cj2的距离,将其加入到最近的聚类中心,计算同一簇群中所有数据的平均值,以此为新的聚类中心;8记录每一次的簇心Cj1,Cj2,若簇心不再变化,或者t≥tmax,或者簇心的fit值小于等于Var,说明算法已收敛,停止当前迭代,记录当前的fit值;反之回到7,t+1,重新进行迭代计算。

全文数据:

权利要求:

百度查询: 湖北第二师范学院 一种基于PSOTVCF-Kmeans算法的意见领袖群识别方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。