基于视觉自注意力网络的视频块级率失真优化方法及系统

导航：龙图腾网> 最新专利技术> 基于视觉自注意力网络的视频块级率失真优化方法及系统

申请/专利权人：北京大学

申请日：2022-06-27

公开（公告）日：2024-06-28

公开（公告）号：CN115278249B

主分类号：H04N19/147

分类号：H04N19/147;H04N19/176;H04N19/42;G06N3/0464;G06N3/08

优先权：

专利状态码：有效-授权

法律状态：2024.06.28#授权;2022.11.18#实质审查的生效;2022.11.01#公开

摘要：本发明公开一种基于视觉自注意力网络的视频块级率失真优化方法及系统，属于数字视频增强领域，将多头自注意力机制引入视频压缩后处理任务中，充分利用自注意力机制强大的建模能力学习受损帧到无损帧的映射，并构建3种基于视觉自注意力网络的后处理模型，引入多种网络架构针对不同内容进行块级率失真优化，从而高效消除视频在解码重建时产生的伪影和压缩噪声。

主权项：1.一种基于视觉自注意力网络的视频块级率失真优化方法，其特征在于，包括以下步骤：构建基于视觉自注意力网络的后处理模型，该后处理模型包括浅度特征提取层、深度特征提取层和重建层；该深度特征提取层包括连续若干残差块，每个残差块包括连续若干视觉自注意力块及一个卷积层；每个视觉自注意力块包括两个残差块，第一个残差块由归一化层和多头自注意力层组成，第二个残差块由归一化层和两层感知机层组成；上述构建的后处理模型具体包括3种后处理模型，该3种后处理模型的区别在于所述多头自注意力层分别选用传统的多头自注意力层、多头特征线性变换层和分组卷积层；利用训练数据集对该3种后处理模型进行训练；对于原始受损帧，在视频编码端先读出视频压缩编码的率失真优化参数，使用训练完成的所述3种后处理模型对编码环生成的视频受损帧进行处理，通过浅度特征提取层提取浅层特征，再通过深度特征提取层从浅层特征中提取深层特征，再经过重建层生成3种后处理帧；将上述3种后处理帧加上未处理的受损帧组成4种待选帧，在该4种待选帧上使用相同的划分方法递归划分出块，求出每个块与原始受损帧对应位置的均方误差，然后求出每个块的划分消耗的码率，取出率失真损失最小的块组成最后的重建视频帧。

全文数据：

权利要求：

百度查询：北京大学基于视觉自注意力网络的视频块级率失真优化方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种配电网规划用的智慧配电网架

下一篇：一种安装工具

相关技术

一种配电网规划用的智慧配电网架

一种安装工具

一种液体沥青取样装置

一种单因子加药泵回水安全阀

一种巡检方便的电容补偿柜

一种防滑型无纺布的裁剪装置

一种圆管弯曲成型装置

一种螺旋输送装置

电芯和电子设备

一种水利施工用混凝土搅拌装置

一种泡菜水检测用的取样装置

一种高选择性紧凑型超宽带滤波器的拓扑结构及滤波器

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于视觉自注意力网络的视频块级率失真优化方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务