基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法

导航：龙图腾网> 最新专利技术> 基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：东莞迪赛软件技术有限公司;电子科技大学广东电子信息工程研究院

摘要：本发明公开了一种基于深层多词嵌入Bi‑LSTM残差网络的健康舆情分析方法，涉及信息技术领域，该基于深层多词嵌入Bi‑LSTM残差网络的健康舆情分析方法通过改进Bi‑LSTM网络，结合多词嵌入以及残差网络方法，提高了网络的鲁棒性，使之能够对复杂舆情文本进行处理，得到了很好的效果，从而提高其分类器的分类精度。

主权项：1.一种基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法，其特征在于：所述基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法通过各种渠道收集大量的文本语料，进行预处理和分词后，得到文档和词语数据，使用包括Word2Vec，Glove，FastText在内的新型词向量训练工具进行词向量训练，得到多个预训练词向量，整个深度神经网络由多个子网络构成，对于每一个子网络而言，其结构相同，但使用不同的预训练词向量，将多个子网络的输出通过Attention机制进行提取拼接后，作为全连接层的输入，并在网络末端将全连接层的输出作为sigmoid层的输入，用于最后的分类，此外，区别于直接将上一层Bi-LSTM的输出直接作为下一层Bi-LSTM的输入，将上一层Bi-LSTM的输出与上上一层Bi-LSTM的输出进行加和计算，将加和结果作为下一层Bi-LSTM层的输入，从而将人工神经元残差随网络传递，达到防止网络退化的目的。

全文数据：基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法技术领域本发明涉及信息技术领域，特别涉及一种基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法。背景技术网络舆情分析是结合了包括互联网信息监测、舆情态势分析、舆论环境研究、网络危机处置和互联网信息监测在内的一种新兴技术。通过及时监测、收集网上相关的舆论信息，加以分析后做出决策，对维护公共秩序和稳定起到重要的作用。研究表明，网络的深度是实现好的效果的重要因素。然而梯度弥散爆炸成为训练深层次的网络的障碍，导致无法收敛。有一些方法可以弥补，如归一初始化，各层输入归一化，使得可以收敛的网络的深度提升为原来的十倍。然而，虽然收敛了，但网络却开始退化了，即增加网络层数却导致更大的误差。此外，现有深度学习模型多是仅使用一个预训练的词向量作为网络输入，局限了网络能够学习的特征空间。预训练词向量是由有限量的语料训练得到的，因此对于不同的文本语料其表现会有较大浮动。发明内容本发明所要解决的技术问题是提供一种基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法，通过对Bi-LSTM模型进行改进，引入深度残差网络，使网络在深度上能够大大增加。通过引入多个词向量，使得网络能够同时从多个特征空间学习，提高网络鲁棒性。为实现上述目的，本发明提供以下的技术方案：该基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法通过各种渠道收集大量的文本语料，进行预处理和分词后，得到文档和词语数据，使用Word2Vec，Glove，FastText等新型词向量训练工具进行词向量训练，得到多个预训练词向量，整个深度神经网络由多个子网络构成，对于每一个子网络而言，其结构相同，但使用不同的预训练词向量，将多个子网络的输出通过Attention机制进行提取拼接后，作为全连接层的输入，并在网络末端将全连接层的输出作为sigmoid层的输入，用于最后的分类，此外，区别于直接将上一层Bi-LSTM的输出直接作为下一层Bi-LSTM的输入，将上一层Bi-LSTM的输出与上上一层Bi-LSTM的输出进行加和计算，将加和结果作为下一层Bi-LSTM层的输入，从而将人工神经元残差随网络传递，达到防止网络退化的目的。该基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法的具体步骤如下：Step1：对舆情文本数据进行预处理，填补缺失值；Step2：使用不同的语料分别训练多个词向量；Step3：利用keras搭建适用于文本数据的Bi-LSTM网络；Step4：使用残差连接方法加深Bi-LSTM网络，引入多个词向量同时进行训练；Step5：通过实验对比本专利改进过后的深层多词嵌入Bi-LSTM残差网络ours和传统单词嵌入的Bi-LSTM、未使用残差连接的深层Bi-LSTM网络、未使用多词嵌入的深层Bi-LSTM残差网络对舆情文本数据的分类效果，从准确率的角度上验证改进的深层多词嵌入Bi-LSTM残差网络的有效性。采用以上技术方案的有益效果是：经过该基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法改进过后的深层多词嵌入Bi-LSTM残差网络模型分类准确率皆明显高于其他三个模型，对数损失值明显更低，并且随着迭代次数的增加，改进过后的深层多词嵌入Bi-LSTM残差网络模型始终优于其他三个模型。附图说明下面结合附图对本发明的具体实施方式作进一步详细的描述。图1是循环神经网络RNN原理图；图2是Bi-LSTM的结构图；图3是shortcut连接原理图；图4是五个模型分类效果比较曲线图；图5是深层多词嵌入Bi-LSTM残差网络结构图。具体实施方式下面结合附图详细说明本发明基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法的优选实施方式。图1至图5出示本发明基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法的具体实施方式：文本情感分类作为网络舆情分析中的核心环节，对于舆情的分析和预测具有非常重要的作用，尤其是面向复杂的中文文本舆情时，中文文本情感分类的准确率的高低直接影响着舆情分析的成败。应用传统方法的中文文本情感分类研究主要围绕浅层学习的词典建模分析和机器学习算法推演而开展，其存在着两大缺陷：一是对于有限数据不具备表征复杂函数的能力，因此涉及复杂分类时其泛化能力将会受到限制；二是通常依靠人工来抽取样本特征，但是人工特征选取非常费时费力，并且不能保证特征的质量。深度学习方法能够解决传统方法的诸多弊端，其具备两大优势：一是构造深层非线性网络结构，使得深度学习能够在大量样本集中自主学习得到数据集的本质特征，即能够对复杂的中文数据进行组合从而拟合文本信息，达到非线性提取文本特征的目的；二是充分利用海量训练数据，在巨量数据下只有具备复杂结构的模型才能够对数据进行充分的拟合和分析，进而挖掘出数据中隐含的有价值信息。在文本分类领域中，深度学习能自动从大量样本中学习到文本语义信息，并进行特征表示，从而实现具体的计算任务。因此，深度学习的引入是中文文本情感分类和舆情分析的又一个有力工具。如图1所示，循环神经网络RNN是一种对序列数据建模的神经网络，即一个序列当前的输出与前面的输出也有关。具体的表现形式为网络会对前面的信息进行记忆并应用于当前输出的计算中，即隐藏层之间的节点不再无连接而是有连接的，并且隐藏层的输入不仅包括输入层的输出还包括上一时刻隐藏层的输出。RNN与普通神经网络的不同之处在于其允许我们对向量的序列进行操作：输入可以是序列，输出也可以是序列，在最一般化的情况下输入输出都可以是序列。LongShort-TermMemoryNeuralNetwork——一般就叫做LSTM，是一种RNN特殊的类型。LSTM由Hochreiter&Schmidhuber1997提出，并在近期被AlexGraves进行了改良和推广。在很多问题上，LSTM都取得相当巨大的成功，并得到了广泛的使用。LSTM通过刻意的设计来避免梯度消失问题，并且能够记住长期的信息，在实践中，LSTM只需要付出很小的计算代价就能获得比RNN更好的效果。Bi-directionalLSTMBi-LSTM是LSTM的一种网络结构，能够使网络同时学习到历史以及未来的文本依赖信息，实践上能够提升LSTM的表现。Bi-LSTM的结构图如图2所示。深度残差网络在2015年首先被提出。作者根据输入将层表示为学习残差函数。实验表明，残差网络更容易优化，并且能够通过增加相当的深度来提高准确率。核心是解决了增加深度带来的副作用退化问题，这样能够通过单纯地增加网络深度，来提高网络性能。相比于传统的深度网络，残差网络在结构上引入了shortcut连接，如图3所示。传统的文本处理方法一般以词为基本特征，将词表示为二进制编码的向量，该向量的维度等于词表的长度，向量中的元素仅有一个值为1，代表该词在辞典里的位置，其他值均为0。使用这种方式表示的词向量不仅向量维度高、特征稀疏，难以计算，而且任意两个词之间相互独立，无法正确捕捉到隐含在词语之间的语义及词法关联。而且由于维度过高，使得其用于神经网络训练变得十分困难，甚至是不可行的。分布式词向量的出现使得将词向量用于深度网络学习成为可能。分布式词向量将词语表示为一个浓密的、低维的实值向量，该向量的每个维度都代表了词语的一个特征属性，各向量之间只需进行简单的余弦计算即可挖掘出词语间的各种关联。该方法最初由美国的Bengio推广，采用一个具有三层结构的神经网络搭建语言模型，通过计算一个句子中第N+1个词出现在已知的前N个词下的条件概率，并最小化其与真实概率分布值之间的误差项来对模型进行优化。由于存在隐藏层，该方法的训练时间较长。如图5所示，词向量的预训练存在语料和模型上的差异，而这些差异正是提高模型鲁棒性的关键。首先，通过各种渠道收集大量的文本语料，进行预处理和分词后，得到文档和词语数据。使用Word2Vec，Glove，FastText等新型词向量训练工具进行词向量训练，得到多个预训练词向量。整个深度神经网络由多个子网络构成。对于每一个子网络而言，其结构相同，但使用不同的预训练词向量。将多个子网络的输出通过Attention机制进行提取拼接后，作为全连接层的输入，并在网络末端将全连接层的输出作为sigmoid层的输入，用于最后的分类。此外，区别于直接将上一层Bi-LSTM的输出直接作为下一层Bi-LSTM的输入，将上一层Bi-LSTM的输出与上上一层Bi-LSTM的输出进行加和计算，将加和结果作为下一层Bi-LSTM层的输入，从而将人工神经元残差随网络传递，达到防止网络退化的目的。具体步骤如下：Step1：对舆情文本数据进行预处理，填补缺失值。Step2：使用不同的语料分别训练多个词向量。Step3：利用keras搭建适用于文本数据的Bi-LSTM网络。Step4：使用残差连接方法加深Bi-LSTM网络，引入多个词向量同时进行训练。Step5：通过实验对比本专利改进过后的深层多词嵌入Bi-LSTM残差网络ours和传统单词嵌入的Bi-LSTM、未使用残差连接的深层Bi-LSTM网络、未使用多词嵌入的深层Bi-LSTM残差网络对舆情文本数据的分类效果，从准确率的角度上验证改进的深层多词嵌入Bi-LSTM残差网络的有效性。表1五个模型分类效果比较由表1和图4可看出，在同一数据集下，本专利改进过后的深层多词嵌入Bi-LSTM残差网络模型分类准确率皆明显高于其他三个模型，对数损失值明显更低，并且随着迭代次数的增加，改进过后的深层多词嵌入Bi-LSTM残差网络模型始终优于其他三个模型。以上的仅是本发明的优选实施方式，应当指出，对于本领域的普通技术人员来说，在不脱离本发明创造构思的前提下，还可以做出若干变形和改进，这些都属于本发明的保护范围。

权利要求：1.一种基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法，其特征在于：所述基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法通过各种渠道收集大量的文本语料，进行预处理和分词后，得到文档和词语数据，使用Word2Vec，Glove，FastText等新型词向量训练工具进行词向量训练，得到多个预训练词向量，整个深度神经网络由多个子网络构成，对于每一个子网络而言，其结构相同，但使用不同的预训练词向量，将多个子网络的输出通过Attention机制进行提取拼接后，作为全连接层的输入，并在网络末端将全连接层的输出作为sigmoid层的输入，用于最后的分类，此外，区别于直接将上一层Bi-LSTM的输出直接作为下一层Bi-LSTM的输入，将上一层Bi-LSTM的输出与上上一层Bi-LSTM的输出进行加和计算，将加和结果作为下一层Bi-LSTM层的输入，从而将人工神经元残差随网络传递，达到防止网络退化的目的。2.根据权利要求1所述的基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法，其特征在于：所述基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法的具体步骤如下：Step1：对舆情文本数据进行预处理，填补缺失值；Step2：使用不同的语料分别训练多个词向量；Step3：利用keras搭建适用于文本数据的Bi-LSTM网络；Step4：使用残差连接方法加深Bi-LSTM网络，引入多个词向量同时进行训练；Step5：通过实验对比本专利改进过后的深层多词嵌入Bi-LSTM残差网络ours和传统单词嵌入的Bi-LSTM、未使用残差连接的深层Bi-LSTM网络、未使用多词嵌入的深层Bi-LSTM残差网络对舆情文本数据的分类效果，从准确率的角度上验证改进的深层多词嵌入Bi-LSTM残差网络的有效性。

百度查询：东莞迪赛软件技术有限公司电子科技大学广东电子信息工程研究院基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：显示装置

下一篇：一种多通道绿化带快速种植设备及其工作方法

相关技术

显示装置

一种多通道绿化带快速种植设备及其工作方法

副本存储方法、装置、存储介质及计算机设备

一种利用手机信令数据识别家庭关系的方法

一种智能分布式热源装置

一种托辊式管状带式输送机

一种导航终端对天高动态测试方法

一种基于BTBC模型的知识图谱构建方法

一种智能型链条张紧装置

一种流量控制阀

wifi接收机的工作模式确定方法、装置、设备及存储介质

一种局部坐标系下的一维水动力模拟方法及装置

网络相关技术

操作网络节点_亚德诺半导体国际无限责任公司_202410560891.X

非地面网络接入_瑞典爱立信有限公司_202380026869.0

网络切片感知小区选择_苹果公司_202080096294.6

自动网络设备配置_慧与发展有限责任合伙企业_202410279154.2

网络接入方法及装置_华为技术有限公司_202310510016.6

神经网络运算电路_新唐科技日本株式会社_202380025686.7

网络模型压缩方法、装置_腾讯科技(深圳)有限公司_202011455193.1

一种量子保密通信网络的交换网络_北京电子科技学院_202410920333.X

去中心的网络设备系统、去中心的网络构建方法及设备_锐捷网络股份有限公司_202310511065.1

一种衍射神经网络以及三维衍射神经网络_深圳迈塔兰斯科技有限公司_202411023504.5

差相关技术

卫星钟差预报方法及系统_河南地矿职业学院_202411159384.1

低压差线性稳压器和稳压方法_忆月启函(成都)科技有限公司_202411079454.2

高压输入低压差调节器电路_微芯片技术股份有限公司_202280093794.3

基于标准差检测的候选顺序分析设备_南京涛卿菲信息科技有限公司_202411284330.8

一种高速信号差分走线结构_深圳市一博科技股份有限公司_202420073162.7

一种运用内循环压力差的纳米粉体收集装置_江苏镭明新材料科技有限公司_202420901128.4

嵌入式系统根文件系统差分升级方法、装置、介质及设备_西安万像电子科技有限公司_202411162968.4

基于级联残差注意力网络的UWB测距误差补偿方法与设备_东南大学_202411100713.5

一种田园搬运管理机用差速装置_广西玉柴农业装备有限公司_202420710659.5

基于差分进化算法的钢-混凝土组合梁构件截面优化方法_杭州铁木辛柯工程设计有限公司_202411091601.8

残相关技术

一种金银花农残检测装置_湖北明腾生物科技股份有限公司_202420396038.4

一种深孔盲残炮处理装置_金川集团股份有限公司_202420379566.9

基于统计约束的SMOTE和自步残差的故障诊断方法_广东石油化工学院_202410918342.5

秸秆粉碎还田与残膜回收一体机_石河子大学_202310502693.3

一种用于水泥罐车的残料收集装置_广西罗城鑫华源实业有限公司_202420608547.9

一种10kV零残压防雷保护装置及其保护方法_泉州市亿胜电气设备有限公司_202411169632.0

基于级联残差注意力网络的UWB测距误差补偿方法与设备_东南大学_202411100713.5

一种残极余热回收的装置及其方法_贵州华仁新材料有限公司_202411117331.3

一种基于残差网络的图像分类方法、装置、设备及介质_北京理工大学重庆创新中心_202111244501.0

一种用于去除半导体表面残胶的方法及其应用_赣南医科大学_202410946585.X

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于深层多词嵌入Bi-LSTM残差网络的健康舆情分析方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务