一种基于多特征融合加权的微博文本立场检测方法

导航：龙图腾网> 最新专利技术> 一种基于多特征融合加权的微博文本立场检测方法

申请/专利权人：上海海事大学

申请日：2020-10-10

公开（公告）日：2024-05-14

公开（公告）号：CN112214991B

主分类号：G06F40/216

分类号：G06F40/216;G06F40/242;G06F40/284;G06F18/25;G06F16/35

优先权：

专利状态码：有效-授权

法律状态：2024.05.14#授权;2021.01.29#实质审查的生效;2021.01.12#公开

摘要：本发明公开了一种基于多特征融合加权的微博文本立场检测方法，包含：S1、根据指定话题采集相应话题下的所有评论文本，将所有评论文本汇聚于数据集中；S2、对步骤S1中的数据集中的评论文本进行预处理操作；S3、计算步骤S2中所得的每个评论文本的词语的重要性standardx，提取每个评论文本的特征词；S4、提取每个评论文本中的情感词，将所述情感词与步骤S3中的特征词共同作为原文本，对所述原文本进行词向量映射；S5、将步骤S4所得的数据输入SVM分类器以判断目标文本情感极性倾向。其优点是：该方法通过考虑多个方面的属性特征计算词语的权重，筛选出具有更强意义的特征词，从而提高情感立场倾向检测的准确性，提高对大众舆情事件的响应速度。

主权项：1.一种基于多特征融合加权的微博文本立场检测方法，其特征在于，包含：S1、根据指定话题采集相应话题下的所有评论文本，将所有评论文本汇聚于数据集中；S2、对步骤S1中的数据集中的评论文本进行预处理操作；S3、计算步骤S2中所得的每个评论文本的词语的重要性standardx，提取每个评论文本的特征词；S4、提取每个评论文本中的情感词，将所述情感词与步骤S3中的特征词共同作为原文本，对所述原文本进行词向量映射；S5、将步骤S4所得的数据输入SVM分类器以判断目标文本情感极性倾向；所述步骤S3中，根据词语权重公式计算每个评论文本的词语的重要性standardx；所述步骤S3中的词语权重公式的构造方式包含：S31、统计数据集中各词语词频，使用对数函数对词频值进行映射，通过公式1合理化词频对特征词提取时的影响，其中，wordfrequencex函数表示在对词语x的绝对词频采用对数函数降频后的词频值，d表示总文本数，ki表示词语x在评论文本i中的词频；S32、根据公式2计算词语在不同类间的平均信息熵entropyx，其中，entropyx表示词语x的类间平均信息熵，C取类别数，pix表示词语x出现在某一类别的概率，根据公式3由平均信息熵entropyx转换为权重加权值importancex，importancex＝1-entropyx3；S33、根据公式4对词语的词长权重lengthx做出修正，lengthx＝true_lengthxα4，其中，true_lengthx表示词语的实际长度，α表示当前数据集下词长种类的中位数；S34、根据公式5构造词语的词频特征frequencex，其中，N表示总评论文本数，Nx表示包含词语x的评论文本数；S35、结合步骤S31～S34构造特征提取的词语权重公式，所述词语权重公式为：standardx＝frequencex*importancex+lengthx6。

全文数据：

权利要求：

百度查询：上海海事大学一种基于多特征融合加权的微博文本立场检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种泡菜水检测用的取样装置

下一篇：一种脱模剂集中供料装置

相关技术

一种泡菜水检测用的取样装置

一种脱模剂集中供料装置

生产混凝土用碎石仓

混料搅拌装置

一种房建施工用安全防坠装置

一种带固定结构的冲压装置

一种砻谷机风选取粮器

一种细分子印刷喷粉加工用研磨装置

电芯和电子设备

一种用于无级变速器的传动带金属环结构

一种空调器自清洁系统油污沉淀装置

一种茶叶生产用高效翻炒装置

微博相关技术

一种卡博替尼或其盐的制备方法_江苏先声药业有限公司_201911302056.1

微流体设备_银丝佛若有限公司_202280076633.3

微喷带支架_宁阳县农业农村局_202323339364.6

三腔微导管_深圳北芯生命科技股份有限公司_202211675338.8

三腔微导管_深圳北芯生命科技股份有限公司_202211682447.2

微通道板式颗粒换热器_浙江高晟光热发电技术研究院有限公司_202211690475.9

评价微RNA的方法_强生消费者公司_202280077048.5

一种用于微透镜回流的支撑装置及微透镜回流设备_苏州苏纳光电有限公司_202323427651.2

活性金属微球、基于活性金属微球的复合栓塞剂及其应用_重庆百迈腾世医药科技有限公司_202210469169.6

一种微耕机照明安装结构及微耕机_重庆华世丹农业装备制造有限公司_202323518998.8

文本相关技术

文本识别模型训练方法、文本识别方法、装置及存储介质_北京百度网讯科技有限公司_202310019561.5

编码器优化的文本渲染_安讯士有限公司_202311785952.4

文本情感分析方法和装置_北京百度网讯科技有限公司_202110818598.5

文本处理方法及装置_华为技术有限公司_201911335070.1

文本识别方法和装置_深圳市星桐科技有限公司_202210660171.1

一种文本标注方法及软件产品_深圳思为科技有限公司_202111408204.5

识别图像中文本的方法、装置和系统_华为技术有限公司_201911391341.5

文本信息的确定方法及电子设备_联想(北京)有限公司_202410323963.9

文本识别方法、装置、设备及存储介质_深圳市星桐科技有限公司_202210661531.X

一种文本生成方法及装置_北京深言科技有限责任公司_202410250261.2

加权相关技术

基于加权slope one算法的协同过滤推荐方法_重庆邮电大学_202410339006.5

具有自适应加权输入的注视确定机器学习系统_辉达公司_202011475665.X

一种区块链动态加权抵御力博弈多根共治安全方法_刘星希_202311855450.4

一种通道加权结构重复控制器及控制方法_江南大学_202010067989.3

一种基于指数加权算法的电压/电流谐波优化方法及装置_中国电力科学研究院有限公司_202410297364.4

一种基于平滑加权轮询算法的动态AI分析的方法和装置_北京英诺威讯科技有限公司_202410358884.1

基于非平衡加权Cycle_MLP网络的体质识别方法和系统_华南理工大学_202310502346.0

一种基于改进加权最小二乘法的监护服务机器人及方法_江苏师范大学_202011576189.0

一种基于信号分解和加权决策的电站机组故障诊断方法_华电福新周宁抽水蓄能有限公司_202410647035.8

一种加权耦合最弱链模型的缺口结构概率疲劳寿命预测方法_电子科技大学_202111287109.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于多特征融合加权的微博文本立场检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务