买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:上海财经大学
摘要:本发明公开了一种新闻报道影响力分析方法,包括步骤:多线程和异步抓取;数据解析和标准化;根据新闻报道的版面P、作者A、报道内容C与情感E的特征,采用基于统计四分位数的PACE‑Q模型计算新闻报道的影响力。本发明方法通过利用爬虫技术,能够自动收集和处理来自不同新闻网站和社交媒体平台的大量信息,并通过考虑多个维度并结合统计学原理的新闻报道影响力算法,能够全面、客观评估每条新闻报道的影响力,本发明通过多种技术的整合,提供一个系统性的解决方案,为公众提供一个更清晰、更全面的信息视角。
主权项:1.一种新闻报道影响力分析方法,其特征在于,包括如下步骤:S1、多线程和异步抓取:为了提高数据抓取的效率,采用多线程和异步IO操作的爬虫系统,同时对多个网页进行新闻报道数据的抓取和处理;S2、数据解析和标准化:在抓取到新闻报道数据后,使用解析库来解析HTML或XML文档,并通过预先定义的模板和规则提取出关键信息;此外,对所有抓取到的新闻报道数据进行标准化处理,确保数据格式的统一,便于后续分析;S3、根据新闻报道的版面P、作者A、报道内容C与情感E的特征,采用基于统计四分位数的PACE-Q模型计算新闻报道的影响力:S3.1、对每条新闻报道收集以下特征数据:版面P:新闻报道的版面位置;作者A:作者的知名度和专业背景;内容C:报道内容的质量;情感E:报道引发的公众情感反应;S3.2、特征量化:将步骤S3.1中获取的特征量化为数值,便于计算,具体地:版面P:将每个版面按照版面的重要性从1-N进行排序,其中N是最重要的版面,根据新闻报道所在的版面位置,将该新闻报道的版面特征量化为1-N中对应的数值;作者A:根据作者过去的影响力记录,从1到M进行评分,其中M代表最高影响力;内容C:通过专家评审或自动化内容分析工具,将报道内容质量评分为1到K,K代表最高质量;情感E:使用情感分析工具,根据报道内容和用户互动,将情感特征量化为一个介于-1即极度负面到1即极度正面的分数;S3.3、计算四分位数:对于每个特征,计算其在所有新闻报道中的数据点的四分位数Q1,Q2,Q3,其中,Q1为处于25%位置上的值,Q3为处于75%位置上的值,Q2为中位数;S3.4、影响力得分计算:每条新闻报道的每个特征的得分基于其相对于相应的四分位数的位置进行计算:如果一个特征的值位于对应的Q3以上,那么这个特征的得分为4;如果一个特征的值位于对应的Q2和Q3之间,含Q2,那么这个特征的得分为3;如果一个特征的值位于对应的Q1和Q2之间,那么这个特征的得分为2;如果一个特征的值位于对应的Q1以下,那么这个特征的得分为1;S4、综合影响力得分计算:每条新闻的综合影响力得分是其四个特征得分的加权平均,计算公式如下:总得分=[Wp×Sp+WA×SA+WC×SC+WE×SE]Wp+WA+WC+WE;其中,Sp、SA、SC、SE分别是版面、作者、内容、情感的得分,Wp、WA、WC、WE是对应的权重。
全文数据:
权利要求:
百度查询: 上海财经大学 一种新闻报道影响力分析方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。