基于条件融合的多模态反讽检测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：杭州电子科技大学

摘要：本发明公开了一种基于条件融合的多模态反讽检测方法。本发明具体步骤：步骤1、对需要进行反讽检测的数据文本进行预训练；对数据文本对应的视频和音频进行编码，得到视频特征和音频特征；步骤2、将处理好的数据文本馈送到编码器TE中；将数据的视频特征和音频特征通过多头注意力机制获得与情感相关的语境信息；步骤3、将语境信息以增量参数的形式加入到编码器的层归一化的增益g和偏置b中，将视频、音频特征融合到文本特征中，获得融合后的语义编码；步骤4、将语义编码通过softmax层进行讽刺的极性分类；本发明方法具有更好的鲁棒性和检测能力，解决了评论文本中的反讽检测问题。

主权项：1.基于条件融合的多模态反讽检测方法，其特征在于包括如下步骤：步骤1、对需要进行反讽检测的数据文本进行预训练；对数据文本对应的视频和音频进行编码，得到视频特征和音频特征；步骤2、将处理好的数据文本发送到编码器TE中；将数据的视频特征和音频特征通过多头注意力机制获得与情感相关的语境信息；步骤3、将语境信息以增量参数的形式加入到编码器的层归一化的增益g和偏置b中，将视频、音频特征融合到文本特征中，获得融合后的语义编码；步骤4、将语义编码通过softmax层进行讽刺的极性分类；步骤1具体实现如下：1.1对于数据文本，每条训练数据都包含上下文对话Context和目标对话Target，将上下文对话和目标对话联合作为Transformer编码器的输入X，计算方式如下：X＝Context+Target11.2使用Ekphrasis分词工具对输入X进行分词，然后预训练一个Word2vec模型来学习每个词的语义特征以获得词向量表示；1.3对于数据文本对应的音频，通过使用librosa库，提取音频的基础特征；每段音频被切成不重合的小窗，提出不同特征拼接后将每段小窗取平均，对于整段音频就能够得到一个283维的向量；1.4对于数据文本对应的视频，在抽帧后放入一个由ImageNet预训练好的Resnet-152网络进行提取，然后对视频抽帧取平均，获得一个2048维的向量；步骤2具体实现如下：2.1输入序列X发送到Transformer编码器，首先会先经过第一层的多头注意力机制，该多头注意力机制将Head数设置为12，从而生成12个不同的特征矩阵；由于最后的输出矩阵要与输入矩阵大小一致，因此，得到的特征矩阵会按第二个维度拼接起来；然后经过第二层全连接层后得到多头注意力机制层的输出矩阵Z；最后，将Z与X融合得到矩阵R1，用于后面层归一化的操作；其计算过程如下：Z＝MultiHeadQ,K,V＝[head1；...；headh]WO2 R1＝Z+X5其中，分别是查询Q、键K、值V以及多头注意力机制输出矩阵的投影矩阵，h是多头注意力机制的头数，headi是第i个注意力的输出；2.2在每个Transformer编码器的子层中都使用两个关系记忆模块RM；RM的核心内容是使用了多头注意力机制，将来自层归一化的输入向量Rt作为查询Q，视频特征和音频特征联合成F＝{f1,f2,…,fn}作为键K和值V，通过Query和Key的相似度来获得关键的特征信息Ht，并将特征信息通过MLP变换为△gt和△bt，此△gt和△bt将作为条件融入到原始层归一化的g和b中；其次，将RM模块集成到Transformer编码器中，随着多个Transformer编码器的层层叠加，RM模块会不断地从上一层的交互信息中保存有效信息并进一步提取更深层次的抽象信息用于调节Transforme编码器中文本模态的语境信息提取；其计算过程如下：Ht＝fmulti-headRt,F6△gt＝fmlpHt7△bt＝fmlpHt8其中，Rt为层归一化的输入向量，当t＝1时，R1＝Z+X；当t＝0时，R0＝X，即第一次的Query为输入序列X。

全文数据：

权利要求：

百度查询：杭州电子科技大学基于条件融合的多模态反讽检测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种适用于磁敏电流传感器的补偿系统及方法

下一篇：油气储量年度递增预测方法及电子设备

相关技术

一种适用于磁敏电流传感器的补偿系统及方法

油气储量年度递增预测方法及电子设备

轴向磁通电机

一种应用于SO₂浓度测量的烟气混合器

一种立轴冲击式破碎机的转子结构

用于最大允许暴露缓解的用户设备报告

一种髌骨粘连康复治疗训练装置

一种向列相液晶组合物、液晶显示元件及液晶显示器

一种用于土壤检测的土壤钻孔取土装置

一种用于MTS816实验的破碎试样收集装置及使用方法

电动水弹玩具枪

电力检修工具的夹持装置

态相关技术

基于全用户态QUIC协议的多模式文件传输方法_合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)_202411018405.8

一种气态及颗粒态污染物氧化潜势检测装置_复旦大学_202111538163.1

一种大功率热态锻镦熔接机及其熔接工艺_卡洛维德(常州)智能焊接装备有限公司_202411193090.0

一种高阶叠加态LG模式产生装置与产生方法_厦门大学_202410991023.7

一种含流态化高效氧化纤维状铜粉的微型含油轴承材料_中南大学_202211546118.5

具有至少双峰态分子量分布的磺化聚亚芳基砜聚合物(sP)_巴斯夫欧洲公司_202380023911.3

一种中间价态钒氧化合物电子相变材料的制备方法_北京科技大学_202410923291.5

一种适用于红外摄像机的三态隔热冷却装置_武汉科技大学_202010846496.X

基于多层前馈神经网络的涡轮导叶过渡态温度场预估方法_南京航空航天大学_202411251842.4

一种焦炉热态机焦侧炉头砌筑移动式吊篮结构及施工方法_中国五冶集团有限公司_202010546851.1

多模相关技术

模内旋转出模结构_浙江世纪华通车业有限公司_202420327593.1

基于特征分析的多模复合实物仿真方法及系统_西安高商智能科技有限责任公司_202411186245.8

旋转多工位模外快装嵌件注塑模具_赫比(上海)精密模具有限公司_202411396338.3

一种高稳定性多模OTDR校准标准装置_武汉网锐检测科技有限公司_202420439637.X

一种绕线模_联盟自动化设备(苏州)有限公司_202010847836.0

一种鞋带模_惠州市隆昱精密模具有限公司_202323592587.3

一种汽车覆盖件冲压模用下模座_四川成飞集成科技股份有限公司_202323541058.0

一种发电机磁钢模上下模体结构_宁波市元宏电机模具制造有限公司_202323370712.6

隧道仰拱填充侧模支架_中铁二十局集团第四工程有限公司_202420443317.1

一种环模锪孔设备_溧阳市政林农牧机械有限公司_202410791810.7

反讽相关技术

一种直白文本到反讽文本的文本风格转换方法及装置_重庆邮电大学_202210574606.0

一种基于多模态混合交互注意力的反讽识别方法_山东科技大学_202311831383.2

反讽识别方法、装置、计算设备及存储介质_人民网股份有限公司_202311443301.7

基于图的全局语义感知的多模态反讽检测方法_天津大学_202311477745.2

反讽识别方法、装置、计算设备及存储介质_人民网股份有限公司_202311443301.7

基于图的全局语义感知的多模态反讽检测方法_天津大学_202311477745.2

一种基于话题语境的社交媒体评论反讽检测方法_安徽理工大学_202311024868.0

一种面向中文反讽文本的夸张表征词提取方法_安徽理工大学_202311024896.2

一种基于事实和情感对立性的多模态反讽检测方法_南开大学_202310555752.3

基于条件融合的多模态反讽检测方法_杭州电子科技大学_202110659973.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于条件融合的多模态反讽检测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务