【发明授权】一种生成式多模态互利增强视频语义通信方法_南京邮电大学_202310687966.6

导航：龙图腾网> 最新专利技术> 一种生成式多模态互利增强视频语义通信方法_南京邮电大学_202310687966.6

申请/专利权人：南京邮电大学

申请日：2023-06-12

公开（公告）日：2024-06-18

公开（公告）号：CN116939320B

主分类号：H04N21/80

分类号：H04N21/80;H04N21/233;H04N21/234;H04N21/2343;H04N21/2383;H04N21/439;H04N21/44;H04N21/4402;H04N21/438;G06F18/25;G06N3/048;G06N3/0475;G06N3/0499;G06N3/0464;G06N3/0455;G06N3/09

优先权：

专利状态码：有效-授权

法律状态：2024.06.18#授权;2024.04.09#实质审查的生效;2023.10.24#公开

摘要：本发明公开了一种生成式多模态互利增强视频语义通信方法，称为MME‑SC。该方法建立在条件生成对抗网络CGAN的基础上，旨在使用文本作为主要传输载体，利用不同模态之间的互利增强来实现目标语义信息的精准提取，从而完成视频传输任务。在多模态互利增强网络的帮助下，我们从视频的关键帧图像和音频中提取语义信息，并进行差值处理，以确保提取的文本以更少的比特传达准确的语义信息，从而提高系统的容量。此外，本发明设计了一个多帧语义检测模块，以督促视频生成过程中的语义过渡。仿真结果表明，本发明出的框架在复杂噪声环境中对视频的传输具有较高的鲁棒性，特别是在低信噪比条件下，显著提高了视频通信中语义传输的准确性和符号传输速率。

主权项：1.一种生成式多模态互利增强视频语义通信方法，其特征在于，所述方法包括如下步骤：步骤1：预训练文本-图像生成对抗网络和文本-音频生成对抗网络，统称为条件生成对抗网络CGAN网络；步骤2：对发送端视频片段进行关键帧的判定，对每一关键帧进行语义信息提取并输出三模态特征信息；步骤2-1：对视频的关键帧进行判别；步骤2-2：对每一关键帧图像和音频的模态信息进行特征识别，提取文本语义信息，输出图像文本音频三模态特征向量；步骤3：建立多模态互利增强网络模型，网络以三模态特征向量作为输入，经过特征提取和语义信息差分处理，得到文本特征向量E′i、音频模态附加向量Ti'和图像模态附加向量Vi'；步骤3-1：输入单关键帧的图像文本音频三模态特征向量并分别编码；步骤3-2：将文本向量输入到预训练的条件生成对抗网络CGAN网络并生成图像音频；步骤3-3：进行信息差分处理，将步骤2-1中经编码得到的图像音频向量分别与步骤2-2中生成得到的图像音频向量作差分计算，输出文本特征向量E′i、音频模态附加向量Ti'和图像模态附加向量Vi'；步骤4：将三模态信息E′i、Ti'、Vi'输入注意力池化层，得到Ht、He、Hv；步骤5：对Ht、He、Hv进行语义编码；设定语义网络集合引入语义相似度ξ是一个在0和1之间的连续值，其中B·代表了基于转换器的句子-双向编码器BERT的预训练模型，s代表原始文本向量，代表编码后的文本向量，T代表向量的转置，||·||代表词嵌入向量的范数；步骤6：进行信道编码，将语义编码结果进行比特编码并模拟实际信道传输；步骤7：进行信道解码，将接收到的信息进行比特解码得到语义信息；步骤8：进行语义解码，将语义信息通过语义网络解码得到原始的三模态信息Ht、He、Hv；步骤9：在接收端进行视频恢复，条件生成对抗网络输入步骤6、7中解码得到的三模态信息Ht、He、Hv，得到图像、音频和文本三模态的帧信息，同时接收端的图像、音频处理器对图像-文本、音频-文本作相应的差分和增强处理，从而恢复原始的视频帧，经过时序处理，得到完整视频片段；步骤9-1：条件生成对抗网络输入解码得到的三模态信息Ht、He、Hv，图像、音频处理器对图像-文本、音频-文本作相应的差分和增强处理，实现图像音频帧信息还原；步骤9-2：多帧信息匹配性纠错，确保视频多帧的一致性和逻辑性，最终恢复出完整的视频片段。

全文数据：

权利要求：

百度查询：南京邮电大学一种生成式多模态互利增强视频语义通信方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种自润滑长寿命硬质合金串珠及其制备方法和应用_郑州机械研究所有限公司_202311466192.0

下一篇：一种ORB特征匹配融合AMCL的机器人重定位方法_重庆邮电大学_202410163891.6

相关技术

一种自润滑长寿命硬质合金串珠及其制备方法和应用_郑州机械研究所有限公司_202311466192.0

一种ORB特征匹配融合AMCL的机器人重定位方法_重庆邮电大学_202410163891.6

一种基于无人机图像的安全帽与反光衣检测方法_东北林业大学_202410326065.9

用于提供更新的机器学习算法的系统和方法_西门子医疗有限公司_202311623232.8

一种微型电机防水密封检测装置_全南县超亚科技有限公司_202410179550.8

图像解码方法及其装置_LG电子株式会社_202280076929.5

一种通过拖拽组件布局页面的方法_深圳市禾望电气股份有限公司_202410181714.0

小区内犬只预警方法、装置、电子设备和介质_中国电信股份有限公司_202211645591.9

一种在Mesh网络中无缝漫游的方法及系统_广州通则康威科技股份有限公司_202410635119.X

乙烷混合液烃萃取精馏脱碳系统及方法_长庆工程设计有限公司_202211655444.X

无线通信方法及系统_杭州九阳小家电有限公司_202211640089.9

紧急救援呼救方法、装置、系统及车辆_长城汽车股份有限公司_202410325030.3

增强相关技术

利用个人移动系统的增强现实增强的游戏性_斯纳普公司_202280073152.7

图像增强模型的训练、图像增强方法、装置及电子设备_苏州市科远软件技术开发有限公司_202110567235.9

增强的卡紧配合批头设计_阿久曼特知识产权有限公司_202080010998.7

大型船舶增强现实航行系统_江苏扬子鑫福造船有限公司_202323331104.4

自适应图像信号增强系统_广州市壳佰诚科技有限公司_202410354334.2

散热增强型电容器_厦门法拉电子股份有限公司_202410402463.4

一种基于改进直方图均衡化和增强高通滤波的红外图像增强方法_上海悠络客电子科技股份有限公司_202111514444.3

一种基于自增强理论的站用储氢气瓶的自增强工艺_浙江工业大学_202210232407.1

经由增强现实（AR）传递的地图特征_移动眼视觉科技有限公司_202280075298.5

一种增强防护的检修平台_赵虹_202323371905.3

互利相关技术

一种基于互利小波神经网络的高频信息采集边缘计算方法_华北电力大学_202410396419.7

一种生成式多模态互利增强视频语义通信方法_南京邮电大学_202310687966.6

售电个体间互利行为演化博弈模型构建方法、装置、设备及存储介质_广东电网有限责任公司_202310290642.9

一种基于交互利益优先级的端对端电能交易方法_四川大学_202310171495.3

一种林下养鸡畜林互利循环装置_四川科凡农业开发有限责任公司_202223411351.0

一种菌菇叶菜互利协作的垂直农业生产设备及其生产系统_雄安创新研究院_202120986297.9

一种触控键和天线二合一互利的耳机_东莞市逸音电子科技有限公司_201911318096.5

一种闭环循环互利型的食用菌高产栽培技术_重庆定凡农业开发有限公司_202110531382.0

一种林下养鸡畜林互利循环装置_高峰_202022843882.1

一种菌菇叶菜互利协作的垂直农业生产设备及其工作方法_雄安创新研究院_202110509233.4

视频相关技术

视频编码方法_杭州当虹科技股份有限公司_202110598168.7

视频图像控制装置、视频控制器及音视频一体机_珠海视熙科技有限公司_202320151868.6

视频播放方法及装置_维沃移动通信有限公司_202210045065.2

在视频编译系统中使用残差信息的视频解码方法及其设备_LG电子株式会社_202080018152.8

视频抽帧方法、分布式视频分析方法及系统_浪潮通信信息系统有限公司_202410210395.1

视频封面的生成方法、视频发布方法及相关设备_广州虎牙科技有限公司_202210376326.9

基于视频监控和视频会议融合的智能系统_深圳市炫本电子有限公司_202210768285.8

视频解码方法、视频编码设备以及存储比特流的方法_三星电子株式会社_202410344004.5

视频显示方法及装置、控制器、视频显示系统_北京电科智芯科技有限公司_202410476209.9

用于视频解码的方法和设备以及用于视频编码的方法和设备_三星电子株式会社_202410338558.4

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种生成式多模态互利增强视频语义通信方法_南京邮电大学_202310687966.6

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务