首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于视觉自注意力网络的视频块级率失真优化方法及系统 

申请/专利权人:北京大学

申请日:2022-06-27

公开(公告)日:2024-06-28

公开(公告)号:CN115278249B

主分类号:H04N19/147

分类号:H04N19/147;H04N19/176;H04N19/42;G06N3/0464;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2022.11.18#实质审查的生效;2022.11.01#公开

摘要:本发明公开一种基于视觉自注意力网络的视频块级率失真优化方法及系统,属于数字视频增强领域,将多头自注意力机制引入视频压缩后处理任务中,充分利用自注意力机制强大的建模能力学习受损帧到无损帧的映射,并构建3种基于视觉自注意力网络的后处理模型,引入多种网络架构针对不同内容进行块级率失真优化,从而高效消除视频在解码重建时产生的伪影和压缩噪声。

主权项:1.一种基于视觉自注意力网络的视频块级率失真优化方法,其特征在于,包括以下步骤:构建基于视觉自注意力网络的后处理模型,该后处理模型包括浅度特征提取层、深度特征提取层和重建层;该深度特征提取层包括连续若干残差块,每个残差块包括连续若干视觉自注意力块及一个卷积层;每个视觉自注意力块包括两个残差块,第一个残差块由归一化层和多头自注意力层组成,第二个残差块由归一化层和两层感知机层组成;上述构建的后处理模型具体包括3种后处理模型,该3种后处理模型的区别在于所述多头自注意力层分别选用传统的多头自注意力层、多头特征线性变换层和分组卷积层;利用训练数据集对该3种后处理模型进行训练;对于原始受损帧,在视频编码端先读出视频压缩编码的率失真优化参数,使用训练完成的所述3种后处理模型对编码环生成的视频受损帧进行处理,通过浅度特征提取层提取浅层特征,再通过深度特征提取层从浅层特征中提取深层特征,再经过重建层生成3种后处理帧;将上述3种后处理帧加上未处理的受损帧组成4种待选帧,在该4种待选帧上使用相同的划分方法递归划分出块,求出每个块与原始受损帧对应位置的均方误差,然后求出每个块的划分消耗的码率,取出率失真损失最小的块组成最后的重建视频帧。

全文数据:

权利要求:

百度查询: 北京大学 基于视觉自注意力网络的视频块级率失真优化方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。