买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:南京邮电大学
摘要:本发明涉及深度学习技术领域,公开了一种面向跨模态通信的未来帧预测方法,获取跨模态通信系统接收端的触觉数据和视频数据,将所述视频数据的视频帧图像裁剪与对应的所述触觉数据的触觉信号打包作为训练集;建立所述触觉数据辅助下的跨模态视频帧预测模型;对所述触觉数据辅助下的跨模态视频帧预测模型进行训练,计算得到多个损失用于更新跨模态视频帧预测模型的参数;当模型的参数收敛后,得到最优跨模态视频帧预测模型及参数,将跨模态通信系统接收端接收到的历史视频帧和未来帧对应的触觉数据输入训练好的最优跨模态视频帧预测模型,输出为未来视频帧;本发明深入挖掘多模态数据间的内在联系,克服传统单模态视频帧预测导致的模糊问题。
主权项:1.一种面向跨模态通信的未来帧预测方法,其特征在于,所述面向跨模态通信的未来帧预测方法包括以下步骤:获取跨模态通信系统接收端的触觉数据和视频数据,将所述视频数据的视频帧图像裁剪与对应的所述触觉数据的触觉信号打包作为训练集;建立所述触觉数据辅助下的跨模态视频帧预测模型,其中所述跨模态视频帧预测模型包括多尺度预测网络和多尺度融合网络,所述多尺度预测网络包括生成器和辨别器,所述多尺度融合网络包括卷积、上采样和通道相加操作;对所述触觉数据辅助下的跨模态视频帧预测模型进行训练,根据生成多尺度图像计算图像间绝对误差损失和平均平方误差损失,根据最终生成图像与真实图像计算图像间梯度损失,根据生成对抗网络并结合均方误差计算生成图像的对抗生成损失,将计算得到的多个损失用于更新跨模态视频帧预测模型的参数;当模型的参数收敛后,得到最优跨模态视频帧预测模型及参数,将跨模态通信系统接收端接收到的历史视频帧和未来帧对应的触觉数据输入训练好的最优跨模态视频帧预测模型,输出为未来视频帧。
全文数据:
权利要求:
百度查询: 南京邮电大学 一种面向跨模态通信的未来帧预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。