首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于无监督未登录词识别的自媒体语言情感分析方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:北京邮电大学

摘要:本发明提供了一种基于无监督未登录词识别的自媒体语言情感分析方法。该方法包括:模拟字符间的组合构造无监督未登录词识别器,利用无监督未登录词识别器对待分析的自媒体语言进行无监督未登录词识别,得到待分析的自媒体语言的表征;使用自媒体多模态情感分析模型对所述待分析的自媒体语言的表征进行分析,得到待分析的自媒体语言的情感倾向。本发明实现了未登录词识别及表情符语义融合,将提高情感模型面向自媒体平台的分析性能,并适应自媒体平台的发展趋势。同时在分析平台用户语义情感方面,准确率等指标优于现有技术。

主权项:1.一种基于无监督未登录词识别的自媒体语言情感分析方法,其特征在于,包括:模拟字符间的组合构造无监督未登录词识别器,利用所述无监督未登录词识别器对待分析的自媒体语言进行无监督未登录词识别,得到所述待分析的自媒体语言的表征;使用自媒体多模态情感分析模型对所述待分析的自媒体语言的表征进行分析,得到所述待分析的自媒体语言的情感倾向;所述的模拟字符间的组合构造无监督未登录词识别器,包括:定义未登录词为无法被主流分词系统切分识别而又独立成词、表达具体含义的词语,使用多个已有的分词工具结合多种信息进行规则过滤,获得正确处理未登录词的分词结果,该分词结果包括句子和词序列,并将分词结果作为训练语料;基于深度学习网络模型构建一个无监督未登录词识别器,将所述训练语料输入到无监督未登录词识别器,对所述无监督未登录词识别器进行训练,训练完成后,得到训练好的无监督未登录词识别器;所述的利用所述无监督未登录词识别器对待分析的自媒体语言进行无监督未登录词识别,得到所述待分析的自媒体语言的表征,包括:将待分析的自媒体语言输入到所述无监督未登录词识别器中,所述无监督未登录词识别器通过深度学习网络推断待分析的自媒体语言待分析的自媒体语言中的每个字符的标注分类,模拟字符间的组合,其中字符标注定义为四词位标注集{B,M,E,S},B代表标注词的开始字符,E代表标注词的结束字符,M代表标注词的中间字符,S代表单字字符,通过神经网络模型将未登录词识别任务转变为分类子任务,推断每一个字符标注的概率,模拟字符间的组合构造成词,得到未登录词的表征;所述未登录词的表征为向量,该向量是若干个有序数字的序列,所有词的向量维数必须保证是一致的;所述的使用自媒体多模态情感分析模型对所述待分析的自媒体语言的表征进行分析,得到所述待分析的自媒体语言的情感倾向,包括:将各个自媒体平台本身提供的文本信息作为使用自媒体多模态情感分析模型的输入,提取表情符语义向量,使用表情符向量作为注意力机制语义编码,提取多个表情符的特征向量作为注意力层,训练不同表情符在不同文本下的权重影响,模拟表情符对文本的情感作用;将所述待分析的自媒体语言的表征的输入文本分成若干句子,每一个句子单独通过自媒体多模态情感分析模型进行分析,将所有句子的分析结果进行综合,得到所述待分析的自媒体语言的情感倾向。

全文数据:

权利要求:

百度查询: 北京邮电大学 一种基于无监督未登录词识别的自媒体语言情感分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。