首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于神经网络的情感原因对提取方法及系统_广东外语外贸大学_202311854149.1 

申请/专利权人:广东外语外贸大学

申请日:2023-12-29

公开(公告)日:2024-06-07

公开(公告)号:CN117787267B

主分类号:G06F40/279

分类号:G06F40/279;G06F40/216;G06F16/35;G06N3/0464;G06N3/09

优先权:

专利状态码:有效-授权

法律状态:2024.06.07#授权;2024.04.16#实质审查的生效;2024.03.29#公开

摘要:本发明公开了一种基于神经网络的情感原因对提取方法,包括:获取文档及文档对应的词索引序列;基于文档和词索引序列得到文本表示数据;对文本表示数据进行预处理,得到每个词的上下文表示数据;基于上下文表示数据并利用第一解析器的状态和预定义动作得到输入数据;通过第二解析器对文档进行处理,得到篇章特征数据;通过协同注意力机制对篇章特征数据整合,得到篇章表示数据;将篇章表示数据和输入数据分别输入至神经网络进行动作预测,得到动作预测结果;基于动作预测结果得到预测的情感、原因和情感原因关系对。有效融合了外部篇章知识,进一步解决了原因重叠的问题。

主权项:1.一种基于神经网络的情感原因对提取方法,其特征在于,包括:获取文档及所述文档对应的词索引序列;基于所述文档和所述词索引序列得到文本表示数据;对所述文本表示数据进行预处理,得到每个词的上下文表示数据;基于所述上下文表示数据并利用第一解析器的状态和预定义动作得到输入数据;通过第二解析器对所述文档进行处理,得到篇章特征数据;通过协同注意力机制对所述篇章特征数据整合,得到篇章表示数据;将所述篇章表示数据和所述输入数据分别输入至神经网络进行动作预测,得到动作预测结果;基于所述动作预测结果得到预测的情感、原因和情感原因对;得到每个词的上下文表示数据,具体过程为:通过预训练模型word2vec或BERT对所述文本表示数据进行处理,得到初始化词嵌入词向量,并通过随机初始化获得固定词向量;将所述初始化词嵌入词向量和所述固定词向量进行拼接后输入至第一双层Bi-LSTM网络,得到每个词的上下文表示数据;所述第一解析器的状态具体为:所述状态由元组s表示:s=σ,γ,λ,e,β,E,C,P,其中,σ表示存储已处理结果的栈,β表示存储未处理所述上下文表示数据的栈,γ表示暂存元素的缓冲区,λ表示生成元素,e表示解析出的情感元素或原因元素的索引缓存,E表示存储情感元素的存储器,C表示存储原因元素的存储器,P表示存储情感原因对的存储器;所述预定义动作具体为:至少包括:EMO-SHIFT动作、CAU-SHIFT动作、EMO-GEN动作、CAU-GEN动作、ARC动作、NO-ARC动作、SHIFT动作和DELETE动作;所述EMO-SHIFT动作表示:获取情感表达数据中的一个元素;所述CAU-SHIFT动作表示:获取原因表达数据中的一个元素;所述EMO-GEN动作表示:一个情感表达数据构建完成;所述CAU-GEN动作表示:一个原因表达数据构建完成;所述ARC动作表示:情感表达数据和原因表达数据之间存在关系;所述NO-ARC动作表示:情感表达数据和原因表达数据之间不存在关系;所述SHIFT动作表示:执行所述ARC动作或所述NO-ARC动作后将已处理元素移到σ中;所述DELETE动作表示:将单词从β中移出,不被包含在元素中;得到输入数据,具体过程为:通过第二Bi-LSTM网络对β中的数据初始化,得到时间步t时的β状态表示通过Stack-LSTM网络分别学习σ、γ、e和A中各元素的表示,对应得到时间步t时的σ状态表示时间步t时的γ状态表示时间步t时的e状态表示和时间步t时的A的状态表示其中A表示记录历史动作的堆栈;对λ进行处理,得到情感表达数据或原因表达数据的特征表示将和进行拼接,得到输入数据gt: 得到篇章表示数据,具体过程为:获取所述文档中的情感表达数据γεi和原因表达数据λεj;将所述情感表达数据和所述原因表达数据输入至所述第二解析器中,对应得到情感子句EDUεi和原因子句EDUεj;通过所述协同注意力机制中的第一关注通道获取EDUεi分别与γεi和λεj之间的相关程度: 其中,表示基于rεk和EDUεi计算得到的注意力得分的中间变量,rεk表示γεi或λεj的表征,Wa表示第一权重矩阵,Wb表示第二权重矩阵,b表示偏置项,αk1表示第一注意力权重,softmax·表示softmax函数计算操作,Oi表示文档中与特定情感相关的上下文数据;通过所述协同注意力机制中的第二关注通道获取EDUεj分别与γεi和λεj之间的相关程度: 其中,表示基于rεk和EDUεj计算得到的注意力得分的中间变量,αk2表示第二注意力权重,Oj表示文档中与特定原因相关的上下文数据;将Oj和Oi拼接得到所述篇章表示数据O:O=[Oi;Oj];得到动作预测结果,具体过程为:将所述篇章表示数据和所述输入数据进行拼接,得到输入状态数据Dt;基于如下公式预测下一步动作at+1的概率Mat+1:Mat+1=softmaxFFNsDt其中,FFNs·表示分层前馈神经网络;采用集束搜索法保留前B个动作概率最高的状态设为新的状态项集;所述状态项集用于下一步的列表更新,经过迭代更新,直至所有输入数据处理完,选取动作概率最高的状态项集作为预测结果。

全文数据:

权利要求:

百度查询: 广东外语外贸大学 一种基于神经网络的情感原因对提取方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。