首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于数据增强和特征融合的电影评论情感分析方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:南京邮电大学

摘要:本发明公开了一种基于数据增强和特征融合的电影评论情感分析方法,包括:将电影评论文本通过结合TF‑IDF算法和情感词典改进的EDA数据增强并进行预处理,经过Word2Vec模型得到文本的分布式表示,分别输入到带有分段最大池化的TextCNN模型和结合注意力机制的BiLSTM模型中,拼接后输入到softmax层完成情感分类。本发明有效地降低了因在数据增强时选取到关键词和情感词改变文本的原意和情感对分类准度的影响;此外提取了文本的局部特征信息和上下文信息,保留了部分位置信息,具备了获取多次出现强特征的特征信息的能力,注意力机制还可以将注意力放在一些关键词上,提高了电影评论文本情感分类准确率。

主权项:1.一种基于数据增强和特征融合的电影评论情感分析方法,其特征在于,包括以下步骤:步骤一:获取电影评论的文本数据构建数据集并划分训练集和测试集,训练集与测试集中正负面评论都各占预设比例;步骤二:结合TF-IDF算法和情感词典对数据集中的文本数据进行改进的EDA数据增强,并进行预处理操作,包括去除文本中停用词、标点;步骤三:将经过数据增强和预处理后的文本通过Word2Vec模型进行词嵌入,得到文本的词向量表示;步骤四:将步骤三所得的向量送入TextCNN中进行卷积操作,随后使用分段最大池化提取特征并拼接;步骤五:将步骤三所得的向量送入BiLSTM提取上下文信息,随后添加注意力机制;步骤六:将步骤四和步骤五所得结果进行拼接,随后送入全连接层,最后将结果输入到softmax函数中进行情感分类,得到电影评论文本情感分类的概率。

全文数据:

权利要求:

百度查询: 南京邮电大学 一种基于数据增强和特征融合的电影评论情感分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。