一种基于时空聚合运动感知的视频预测方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：电子科技大学

摘要：本发明公开了一种基于时空聚合运动感知的视频预测方法。该方法受动物视觉系统中的方向选择性神经元启发,将复杂运动信息分解为垂直和水平两个分量进行独立处理,实现动态信息的有效提取。其中,方向选择性感知单元采用多层感知器结构实现。由于将运动信息进行降维分解会丢失一定时空关联性，提出了时空聚合门控单元以提高时空关联性。在此基础上,该方法建立了多尺度特征融合网络,包含空间编码器、时序转换模块和空间解码器,实现对多尺度时空特征的提取。通过在人工数据集和真实数据集上的测试,证明了该方法可以有效降低运动模糊,提高视频预测的准确性和连贯性。

主权项：1.一种基于时空聚合运动感知的视频预测方法，该方法包括:步骤1：获取用于训练和验证视频帧预测模型的数据集，符合视频帧预测的数据集应该具备4个维度，分别是视频帧帧数S、视频帧通道数C、视频帧图像高度H、视频帧图像宽度W；步骤2：对获取的数据集进行数据预处理；具体步骤如下：步骤2.1：根据视频帧预测模型的输入视频帧帧数和输出视频帧帧数设置滑动窗口，生成模型输入数据和用于计算预测误差的真实数据对；步骤2.2：根据批大小生成用于训练和验证视频帧预测模型的可被迭代的数据集对象；步骤3：设计视频帧预测模型；模型包括3个部分：空间编码器、时空聚合运动感知器以及空间解码器，具体步骤如下：1空间编码器处理方法为：编码器由L个卷积模块串行连接；每个卷积模块依次由卷积单元、组归一化函数、激活函数顺序相连；此外，每个卷积模块的输出不仅纵向输入到更深层的卷积层中，还会横向输出给时空聚合运动感知器；若卷积模块是空间编码器的首个卷积模块，那么该卷积模块的卷积单元的输入通道数为输入视频帧通道数C；否则，该输入通道数为模型超参数Ch，下标h表示隐藏层；编码器中所有卷积模块的卷积核大小均为3×3，分组归一化的分组数均为2；若卷积模块是编码器的第奇数个卷积模块，那么该卷积模块的卷积单元的卷积步长为1，否则卷积步长为2；其中，代表第i个卷积层的输出，X代表原始视频序列，LeakyReLU·代表激活函数，GroupNorm·代表组归一化，Convi代表第i层的二维卷积运算；将i＝1到i＝L全部进行一次运算，则会得到一个空间编码集将该集合输入到下一层的时空聚合运动感知器进行时间特征提取；该集合包含了空间编码器所提取的不同尺度的空间信息，对这些多尺度的空间信息都进行进一步提取可以提升对不同尺度信息的感知能力；2时空聚合运动感知器的处理方法为：时空聚合运动感知器由L层组成，以对应空间编码器L个卷积模块输出的L个特征；时空聚合运动感知器的每一层都堆叠了多个时空聚合运动感知器单元；具体地，第i层由Ni个时空聚合运动感知器单元STMDAUnit组成；每个STMDAUnit又由三个部分构成：通道缩减，时空聚合运动感知模块，通道扩张；其中，为经过时空聚合运动感知器提取时间特征后的集合，是STMDAUnit的映射函数，上标Ni代表将该映射函数执行N次；3空间解码器的处理方法为：空间解码器处理流程是空间编码器处理流程的逆过程；所有参数均与空间编码器相同，仅将二维卷积运算换成反卷积运动，以将提取后的特征还原为原始视频序列；其中，TransConvi·代表反卷积运算，代表预测的视频序列；步骤3.2：设置实验超参数；步骤4：训练步骤3的视频帧预测模型，具体步骤如下：步骤4.1：定义误差函数，采用均方误差作为训练误差函数，如下：其中，代表预测的视频序列，Y为真实视频序列；T′为视频帧帧数，T为输入视频帧长度，C表示输出视频帧的通道数，H和W分别表示输出视频帧的长和宽；步骤4.2：设置学习率以及迭代轮次；步骤4.3：采用梯度下降法更新视频帧预测模型需要学习的参数，降低模型预测误差；步骤5：对训练完成后的视频帧预测模型进行精度的验证与评估，指标包括均方误差、平均绝对值误差、结构相似性、峰值信噪比指标；步骤6：采用评估通过的视频预测模型进行视频预测。

全文数据：

权利要求：

百度查询：电子科技大学一种基于时空聚合运动感知的视频预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种发动机选配零件装配过程人机交互防错装置及方法

下一篇：独立站数据定向同步方法及其装置、设备、介质

相关技术

一种发动机选配零件装配过程人机交互防错装置及方法

独立站数据定向同步方法及其装置、设备、介质

一种能自动弹出的抽屉式车载冰箱

一种带有短路检测的连接器插针机

一种基于可逆热致变色微胶囊的复合绝缘材料及其制备方法

超临界晶圆清洗/干燥介质回收方法以及系统

一种分层架构下的无人机网络动态任务卸载方法

一种基于非周期非均匀缝隙电容加载的环型宽带水平极化全向天线

一种靶向铜绿假单胞菌凝集素的仿生多功能纳米制剂及其制备方法和应用

一种导热系数低的复合墙体保温砌块及其制备方法

一种高速砂尘温控系统

基于等几何的变刚度复合材料圆柱壳外压屈曲分析方法

运动相关技术

运动信息编码方法、运动信息解码方法和比特流发送方法_三星电子株式会社_202410950618.8

一种具有稳定支撑功能的运动鞋及运动鞋底_温州帆旭鞋业有限公司_202420011186.X

利用光学运动补偿和游戏内运动补偿进行帧插值_联发科技股份有限公司_202410307045.7

双轴直线运动控制方法、系统、装置、运动控制卡及介质_深圳市高川自动化技术有限公司_202410709970.2

一种定位运动控制方法及旋转运动结构_中国科学院苏州生物医学工程技术研究所_202410770301.6

运动信息编码设备、运动信息解码设备和比特流发送方法_三星电子株式会社_202410950589.5

车辆运动控制方法和装置_经纬恒润(天津)研究开发有限公司_202411172333.2

提肛运动监测仪_成都大学附属医院_202211123810.7

一种蛇型运动机构_广西大学_202110069947.8

一种运动评估方法及系统_深圳市韶音科技有限公司_202280079946.4

视频相关技术

一种视频制作用视频剪辑设备_杭州图层影视文化传媒有限公司_202323625697.5

一种基于视频动作的视频检测方法_北京汇畅数宇科技发展有限公司_202311404313.9

视频解码方法、视频编码方法和装置_三星电子株式会社_202410898511.3

视频展示方法及装置_北京达佳互联信息技术有限公司_202111366451.3

视频匹配方法、视频处理方法、装置、电子设备及介质_北京百度网讯科技有限公司_202110520030.5

一种视频处理设备以及视频信号传输方法_杭州海康威视数字技术股份有限公司_202411139889.1

界面显示方法、视频发布方法、视频编辑方法及装置_北京达佳互联信息技术有限公司_202210945497.9

视频目标检测模型的训练、视频目标检测方法及装置_北京达佳互联信息技术有限公司_202110294961.8

视频处理方法、装置、网络视频录像机和存储介质_成都瑞通视讯科技股份有限公司_202410921617.0

基于亿级像素融合视频的多视角监控视频调取方法及系统_苏州一际智能科技有限公司_202410717685.5

感知相关技术

一种智慧护栏感知终端_河北高速公路集团有限公司青银分公司_202420293578.X

一种分数感知装置_沈光银_202420298960.X

一种路面感知设备_河北高速公路集团有限公司青银分公司_202420297471.2

使用说话者相关语音模型的说话者感知_谷歌有限责任公司_202410942126.4

夜间使用的病房感知与呼叫系统_河北大学附属医院_202311546786.2

一种多功能船用态势感知装置_福建毅宏游艇股份有限公司_202322876727.3

动作感知机构、灭火装置及火灾报警系统_上海永曜一合科技有限公司_202420649420.1

一种实时频谱感知方法及系统_中国科学院上海微系统与信息技术研究所_202410591673.2

基于无线传感器的机器人环境感知系统及方法_中国科学院重庆绿色智能技术研究院_202410709010.6

一种通信感知方法、装置、设备及存储介质_北京小米移动软件有限公司_202380008034.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于时空聚合运动感知的视频预测方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务