买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京理工大学
摘要:本发明公开的一种基于Bert多层信息融合与双曲神经网络的情感分类方法,属于自然语言处理中的文本情感分析技术领域。本发明实现方法为:将预处理后的微博文本数据输入Bert嵌入层进行词嵌入,转变成向量的形式。将文本向量进入Bert多层信息特征提取层进行特征提取,进一步挖掘语义信息,通过注意力机制来将Bert中各个隐藏层中的CLS向量进行融合,将融合后的特征向量输入到双曲空间中挖掘深层层次信息,在双曲空间中完成特征聚合,实现高质量的情感分类。本发明特别适用于处理社会舆论网络等复杂网络的情感分类和公共舆论监控,解决传统方法在高维、非欧几里得结构数据空间中的分类难题,提高对网络数据中微博文本的表示和分类能力。
主权项:1.一种基于Bert多层信息融合与双曲神经网络的情感分类方法,其特征在于:包括以下步骤,步骤一:采集指定话题下的微博文本,对文本数据进行预处理,并对微博文本的情感类别进行标注,得到标注后的微博文本数据集,将微博文本数据集作为后续步骤二用于Bert模型的输入;步骤二:对于步骤一得到的微博文本数据集中的微博文本,利用Bert模型多层提取微博文本语义特征;首先构造预训练Bert模型输入,得到Bert模型中隐藏层的输出,利用注意力机制权重分配算法将Bert模型中隐藏层输出中的CLS向量按权重分配成全局句向量xc,将全局句向量xc作为步骤三的输入;步骤三:利用指数映射将步骤二得到每条微博文本对应的全局句向量xE映射到双曲空间,在欧氏空间E与双曲空间H之间转换信息,保留双曲空间的双曲结构特征x0,H作为步骤四的输入;步骤四:将双曲特征向量x0,H输入到双曲神经网络中,在双曲神经网络完成层次信息提取;双曲神经网络通过特征转换、特征聚合以及非线性激活三个步骤实现节点信息的更新;在情感分类层利用Softmax函数将双曲神经网络输出的值转化为概率值,所述概率值代表不同情感类别的可能性,用于执行情感分类;选取概率最高的情感作为预测的分类结果;步骤五:结合损失函数训练步骤四构建的双曲神经网络,得到训练好的双曲神经网络;步骤六:将待分类的微博文本输入到训练好的双曲神经网络,得到待分类的微博文本情感分类结果,即基于双曲神经网络和层次聚类实现微博文本的情感分类。
全文数据:
权利要求:
百度查询: 北京理工大学 一种基于Bert多层信息融合与双曲神经网络的情感分类方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。