恭喜大连民族大学孟佳娜获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜大连民族大学申请的专利一种基于卷积神经网络和注意力机制的反讽识别模型获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114722798B 。
龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210108214.5,技术领域涉及:G06F40/279;该发明授权一种基于卷积神经网络和注意力机制的反讽识别模型是由孟佳娜;朱彦霖;刘爽;孙世昶设计研发完成,并于2022-01-28向国家知识产权局提交的专利申请。
本一种基于卷积神经网络和注意力机制的反讽识别模型在说明书摘要公布了:本发明属于自然语言处理领域,涉及一种基于卷积神经网络和注意力机制的反讽识别模型。包括:S1.文本表示层;S2.语义特征提取层;S3.反讽语义关系建模层;S4.反讽意图判别层。有益效果:本发明能够识别出社交媒体中潜在的反讽表达,挖掘出用户的真实情感倾向,该模型弥补了传统序列模型的不足,实现了句子内部序列之间情感语义关系的建模,同时相比于现有的基于词对矛盾的反讽识别方法,该模型更容易捕捉到反讽效果产生的语义矛盾信息,提高了反讽识别任务的准确性,通过卷积操作隐式地将句子分割成短语片段来提取更高层次的语义特征;可以更准确的捕捉句子短语片段之间的语义不一致性信息。
本发明授权一种基于卷积神经网络和注意力机制的反讽识别模型在权利要求书中公布了:1.一种基于卷积神经网络和注意力机制的反讽识别模型,其特征在于,包括:S1.文本表示层:用于通过预训练语言模型BERT生成单词的词向量;S2.语义特征提取层:用于通过使用文本卷积神经网络CNN层隐式将句子分割成短语片段来提取语义特征,通过注意力Attention层机制协助模型捕获与反讽任务相关度特征,根据特征的重要程度分配不同的权值分数,将特征与权值进行重新加权组合;S3.反讽语义关系建模层:通过对句子内部语义特征之间的语义联合信息进行建模,对句子内部的语义冲突信息进行捕捉;S4.反讽意图判别层:通过线性层降低反讽语义的特征维数、通过softmax层对线性层的输出进行预测,判断文本序列属于是否包含反讽修辞;该模型通过文本表示层将输入文本序列S,通过添加分割标记、转换、训练得到该文本序列的词向量表示矩阵E;将词向量表示矩阵E作为语义特征提取层的输入,利用卷积操作提取特征、将得到的单个短语片段特征拼接成一个特征矩阵M;通过注意力网络对矩阵M的不同语义特征的重要程度进行分析,并为其分配相对应的权值,最后将权值与特征进行重新加权组合,得到最终的语义特征V;语义特征V作为反讽语义关系建模层的输入,通过语义联合信息进行建模、池化、加权求和得到文本序列的反讽语义表示fa;文本序列的反讽语义表示fa为反讽意图判别层的输入,通过线性层降低反讽语义的特征表示fa的维数,softmax层对线性层的输出进行预测,判断文本序列属于是否包含反讽修辞,得到模型的分类结果所述的文本表示层中:使用预训练语言模型BERT对不同语境信息下的反讽文本进行训练,得到包含上下文信息的词嵌入表示;使用预训练语言模型BERT的步骤如下:首先,定义输入文本序列S,S={s1,s2,...si...,sn},其si代表文本序列的第i个单词,n代表文本序列中包含的单词个数;其次,在文本序列的开头和结尾分别添加“[CLS]”和“[SEP]”分割标记,将文本序列转换成BERT模型可以处理的特定格式;最后,将处理好的文本序列送入BERT模型进行训练,得到该文本序列的词向量表示矩阵E,具体过程如公式3.1:E=BERT“[CLS]”+s1,s2,s3,...si...sn+“[SEP]”3.1其中,E={e1,e2,e3...ei...,en},ei∈Rk代表文本序列中第i个单词的词向量表示,k代表词向量的维度;所述的CNN层特征提取步骤包括:1输入文本序列的二维词向量矩阵;2使用不同的卷积核不断与词向量矩阵进行卷积操作,提取文本序列的特征图;3使用最大池化方法对不同尺寸的特征图进行处理,得到定长的单特征;4将所有的单特征拼接成一个简单的特征向量;过程如下:首先,输入文本序列的二维词向量矩阵E,E={e1,e2,e3...ei...,en},其中n代表文本序列中所包含的单词个数,ei∈Rk代表文本序列中第i个单词的词向量表示,k为词向量的维度;其次,将二维词向量矩阵E输入卷积模块,利用卷积核与卷积窗口内文本序列的卷积操作提取短语片段的特征,定义卷积核W的大小为h*k,其中h代表卷积核窗口的大小,它决定了短语片段中所包含的单词个数,短语片段的特征提取过程可以表示为如公式3.2:ci=fW·Ei:i+h-1+b3.2在这里我们定义了一个卷积的函数操作f,ci代表卷积核W与词向量矩阵E中第i个单词到第i+h-1个单词所组成的短语片段进行卷积操作后提取到的短语特征,b是偏置;再次,卷积核W自上而下地完成与整个词向量矩阵E的卷积操作后,得到文本序列中所有短语片段的单个特征图c,c=c1,c2,c3,...ci...,cn-h+1;最后,使用k个与W尺寸相同的卷积核重复进行以上操作,并将得到的特征图进行拼接即可得到短语片段的语义特征矩阵M∈Rn-h+1*k,M=m1,m2,m3,...mi...,mn-h+1,其中mi∈Rk代表文本序列中第i个短语片段的语义特征表示;所述的Attention层,通过给不同的语义特征赋予权重分数,对关键的语义特征进行强化,步骤如下:首先,将特征提取层中提取到的语义特征mi输入到一个线性层中,然后tanh函数对其结果进行处理得到第i个短语的隐层特征表示mi',其中b为偏置,具体过程可以表示为式3.3所示:mi'=tanhW·mi+b3.3其次,根据语义特征mi'和上下文向量q的相似度计算出语义特征mi'的权重分数si,然后使用softmax函数对所有特征的权重分数进行归一化处理,得到最终的权重矩阵a,具体计算过程如公式3.4、3.5、3.6: a=Softmaxs1,s2,s3,...,sn-h+13.5a=a1,a2,a3,...,an-h+13.6最后,将权重分数ai与语义特征mi关联起来得到最终的语义特征V,具体计算方式如公式3.7、3.8:vi=ai*mi3.7V=v1,v2,v3,...,vn-h+1,V∈Rn-h+1*k3.8。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人大连民族大学,其通讯地址为:116600 辽宁省大连市经济技术开发区辽河西路18号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。