一种基于Word2Vec的企业舆情数据分析方法

导航：龙图腾网> 最新专利技术> 一种基于Word2Vec的企业舆情数据分析方法

申请/专利权人：上海品见智能科技有限公司

申请日：2020-11-16

公开（公告）日：2024-04-19

公开（公告）号：CN112347230B

主分类号：G06F16/33

分类号：G06F16/33;G06F16/953;G06F40/216;G06F40/242

优先权：

专利状态码：有效-授权

法律状态：2024.04.19#授权;2021.04.02#实质审查的生效;2021.02.09#公开

摘要：本发明公开了一种基于Word2Vec的企业舆情数据分析方法，包括如下步骤：收集整理步骤、确定情感词典步骤和得出结论步骤，本发明方法通过Word2Vec扩充情感词典，并结合词频、文本长度和阅读量有效的分析文本情绪倾向，避免了未考虑文本长度和文本阅读量对分析情感倾向的影响。此外，本发明创造性地提出了一种基于Word2Vec的企业舆情数据分析方法，用于分析企业的舆论的情绪倾向，从而帮助企业或管理人员有效的分析舆情，进而避免品牌和客户信任危机。

主权项：1.一种基于Word2Vec的企业舆情数据分析方法，包括如下步骤：收集整理步骤、确定情感词典步骤和得出结论步骤；具体为，步骤1，收集整理步骤：定义文本训练集合停用词，并对文本数据集中每个中文文本分词和过滤停用词进行预处理，得到预处理后的文本训练集；步骤2，确定情感词典步骤：定义情感词典，并通过Word2Vec对预处理的文本集训练，结合余弦相似度算法对情感词典未收录的词补充，得到扩充情感词典；步骤3，得出结论步骤：通过扩充的情感词典和改进的情感词典计算方法，计算预处理后文本集的情感值，得到企业舆论的情感值；步骤1中，包括步骤1.1：定义文本数据Txt＝{txt1,txt2,……,txtnum}，其中，num为文本总数；步骤1.2：定义文本停用词集S＝{st1,st2,……,stsn}，其中,sn为停用词数量；步骤1.3：对Txt中文本分词并过滤停用词S，文本预处理后得ft＝{ft1,ft2,……,ftnum}，其中ftp＝{fw1,fw2,……,fwm}为第p篇文本分词后的集合，p∈[1,num]；步骤2中，包括步骤2.1：定义初始情感词典，包含情感词集ew＝{ew1,ew2,……,ews}和对应的情感值集步骤2.2：将文本集ft中每个文本去除重复词，得到词集t＝{t1,t2,……,tb}；步骤2.3：通过Word2Vec训练文本集ft得到t中各词的词向量，并以余弦相似度计算两两词之间的相似度，从而得到任意词相似度大于β的相似集和其对应的相似度其中，wb∈t，wb对应的相似度为其中β默认为0.7；步骤2.4：设c为循环变量，用于遍历词集t，并赋值为1；步骤2.5：当循环变量c＝b时，则执行步骤2.6，否则执行步骤2.10；步骤2.6：当且时，则执行步骤2.7，否则执行步骤2.9；步骤2.7：计算词tc的情感值，其公式为：步骤2.8：将词tc加入情感ew＝ew∪{tc}，词典中；步骤2.9：循环变量c＝c+1，返回执行步骤2.5；步骤2.10：得到补充情感词集ew和对应的情感值集ev；步骤3中，包括步骤3.1：设r为循环变量，用于遍历文本集ft，并赋值为1；步骤3.2：当循环变量r＝num时，则执行步骤3.3，否则执行步骤3.5；步骤3.3：计算文本的情感值，其公式为：式中，fj是词j在文本ftr中的词频，rcr是文本ftr的阅读量,min_rc和max_rc是文本集ft中最小和最大的阅读量，dlr是文本ftr的长度，avgdl是文本集ft中文本的平均长度；步骤3.4：循环变量r＝r+1，返回执行步骤3.2；步骤3.5：通过公式计算文本集ft中的情感值，得到企业舆论的情感值。

全文数据：

权利要求：

百度查询：上海品见智能科技有限公司一种基于Word2Vec的企业舆情数据分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种模具加工用定位装置

下一篇：一种电表排母接口测量装置

相关技术

一种模具加工用定位装置

一种电表排母接口测量装置

一种可快速拼接的安装架

一种两级压缩螺杆式空压机壳体

一种铝箔手提袋

一种带液晶显示屏可调速的墙体切割机

一种具有分级过滤功能的纳滤膜元件

一种工具携行包

一种具有调节功能的塑料藤条结构椅

一种船舶舷外机通风型保护罩

一种散热机箱

一种移动式自填充胶枪

企业相关技术

一种企业安全监控装置_元铭应急技术(江苏)有限公司_202323465287.9

企业商旅费控管理系统_北京合思信息技术有限公司_202410445132.9

一种企业年金仓位调整测算方法_国网福建省电力有限公司综合服务中心_202410308605.0

一种科技企业创新管理分析方法_科学技术部火炬高技术产业开发中心_202310601485.9

一种企业异常的评估系统及评估方法_曹洪_202110144817.6

一种企业安全生产自动监测预警装置_山东正润安全科技有限责任公司_202410675948.0

企业经营地址的挖掘方法、装置、设备及存储介质_丰图科技(深圳)有限公司_202211641621.9

一种基于企业数据的数据库存储优化方法、系统及介质_江西展群科技有限公司_202410685924.3

一种跨平台、企业级桌面软件开发框架_西安一二三云计算有限公司_202410371979.7

一种基于大数据的企业管理方法_广东炬创科技有限公司_202410452561.9

Vec相关技术

一种基于Doc2Vec模型的中文语义扩展查询方法_成都西电网络安全研究院_202410244952.1

一种基于MI-VMD-DA-EDLSTM-VEC的多维特征组合预测方法_武汉科技大学_202110781945.1

一种基于word2vec模型的灾害元数据自动匹配方法及系统_郑州大学_202410142877.8

一种基于深度学习的Part2Vec零件向量化处理方法_深制科技(苏州)有限公司_202011131175.8

一种word2vec模型训练、数据召回方法及装置_网易传媒科技(北京)有限公司_202110035092.7

一种基于Word2vec-QCNN模型的文本表示系统、方法及其在电力领域词库构建的应用_湖南大学_202410228934.4

融合graph2vec、双层LSTM的车辆行程时间预测方法及系统_福州大学_202211206533.6

一种基于Word2Vec的企业舆情数据分析方法_上海品见智能科技有限公司_202011282421.X

一种基于word2vec模型构建词网的方法和装置_浪潮云信息技术股份公司_202010703335.5

一种基于加权融合的Loc2vec模型的重复数据检测方法_西北工业大学_202110824753.4

数据分析相关技术

基于数据分析的设备保养管理系统_无锡芯享信息科技有限公司_202211671357.3

基于大数据分析的医患体验数据工作平台_重庆至道科技股份有限公司_202311858093.7

一种基于大数据的化工数据分析方法_西安石油大学_202410473870.4

一种基于数据分析的电能表数据存储方法及系统_江苏西欧电子有限公司_202410690686.5

一种基于大数据分析的金融投资风险管理数据存放装置_桂林学院_202322773942.0

一种针对订单数据分析处理方法及装置_北京亿家老小科技有限公司_202311742938.6

基于大语言模型的自然语言数据分析方法及系统_北京尚博信科技有限公司_202410549288.1

数据分析方法、装置、计算机设备及存储介质_平安科技(深圳)有限公司_201811188076.6

基于模型和数据分析的磨煤机故障诊断方法及装置_国能(惠州)热电有限责任公司_202211699220.9

一种环保在线监控用数据分析板_鸡西世方环保科技有限公司_202323297060.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于Word2Vec的企业舆情数据分析方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务