恭喜中科方寸知微(南京)科技有限公司冷聪获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜中科方寸知微(南京)科技有限公司申请的专利基于可学习任务感知机制的视频编解码加速方法及系统获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN119031147B 。
龙图腾网通过国家知识产权局官网在2025-05-16发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202411518429.X,技术领域涉及:H04N19/593;该发明授权基于可学习任务感知机制的视频编解码加速方法及系统是由冷聪;夏铮铮;魏学备设计研发完成,并于2024-10-29向国家知识产权局提交的专利申请。
本基于可学习任务感知机制的视频编解码加速方法及系统在说明书摘要公布了:本发明公开了一种基于可学习任务感知机制的视频编解码加速方法及系统,该方法包括获取原始视频序列数据并预处理,计算得到最优图像组长度,构建图像组结构数据;采用目标检测模型,得到目标检测结果;计算目标重要性得分;构建特征向量序列,得到有效性标记,生成优化后的图像组结构数据;输入高分辨率编码器和低分辨率编码器,生成多尺度特征表示,形成量化数据包;使用动态空间选择网络生成空间重要性图,处理得到保留的特征数据,生成编码数据包;使用算术熵解码器,得到量化特征数据,进行反量化,得到反量化特征图;将其输入级联的低分辨率解码器和高分辨率解码器,生成最终视频序列。本发明减少了资源和计算的浪费,提高了编解码效率。
本发明授权基于可学习任务感知机制的视频编解码加速方法及系统在权利要求书中公布了:1.基于可学习任务感知机制的视频编解码加速方法,其特征在于,包括如下步骤:S1、从视频源获取原始视频序列数据,并对其进行预处理,得到预处理后的视频帧数据;基于预处理后的视频帧数据,获取预设数量的连续视频帧数据,形成初始图像组;基于初始图像组,提取视频帧特征;基于视频帧特征,计算得到最优图像组长度;基于最优图像组长度和预处理后的视频帧数据,构建最终的图像组结构数据;S2、基于图像组结构数据中的视频帧,采用预训练的目标检测模型,得到每帧的目标检测结果;基于目标检测结果,计算每帧的目标重要性得分;基于图像组结构数据中的相邻帧,采用光流估计算法,得到帧间运动信息;基于目标重要性得分和帧间运动信息,构建特征向量序列;将特征向量序列输入预训练的图像组选择网络,得到每帧的重要性预测值;根据预设的重要性阈值,对重要性预测值进行二值化处理,得到每帧的有效性标记;将有效性标记与图像组结构数据结合,生成优化后的图像组结构数据;S3、将优化后的图像组结构数据并行输入预训练的高分辨率编码器和低分辨率编码器,得到高分辨率特征图和低分辨率特征图;对其分别采用自注意力机制,得到增强后的高分辨率特征图和低分辨率特征图;将增强后的高分辨率特征图和低分辨率特征图进行特征融合,得到多尺度特征表示;获取当前量化参数,计算动态量化步长;使用动态量化步长对多尺度特征表示进行量化,得到离散化的特征数据;对离散化的特征数据应用熵编码,得到初步压缩的比特流;将初步压缩的比特流和动态量化步长打包,形成量化数据包;S4、对量化数据包进行解析,得到量化特征值;使用预训练的动态空间选择网络处理量化特征值,生成空间重要性图;基于空间重要性图和预设阈值,构建二值掩码;基于二值掩码,对量化特征值进行处理,得到保留的特征数据;将保留的特征数据转换为一维序列,使用上下文自适应二进制算术编码对一维序列进行熵编码,生成压缩比特流;基于二值掩码和压缩比特流,生成编码数据包;S5、对编码数据包进行解析,得到压缩比特流和编码元数据;使用算术熵解码器对压缩比特流进行解码,得到量化特征数据和空间选择掩码;基于空间选择掩码,将量化特征数据重建为二维特征图;使用编码元数据中的量化参数,对二维特征图进行反量化操作,得到反量化特征图;将反量化特征图输入级联的低分辨率解码器和高分辨率解码器,得到高、低解码器的输出;使用特征融合模块将高、低解码器的输出进行合并,得到最终的重建视频帧;基于重建视频帧,采用去块效应滤波器进行处理,得到优化的重建视频帧;基于优化的重建视频帧,生成最终视频序列;步骤S1进一步为:S11、从预设的视频输入接口接收原始视频数据流,将原始视频数据流解析为单独的原始视频序列数据;基于原始视频序列数据,采用高斯滤波算法进行降噪处理,得到降噪后的视频帧数据;将降噪后的视频帧数据从RGB色彩空间转换到YUV色彩空间,得到色彩转换后的视频帧数据;根据预设的目标分辨率,对色彩转换后的视频帧数据进行双线性插值重采样,得到调整分辨率后的视频帧数据;将调整分辨率后的视频帧数据按时间顺序存储到帧缓冲器;S12、从帧缓冲器中读取预设数量的连续视频帧数据,对连续视频帧数据进行帧间差分计算,得到帧间差异值序列;使用滑动窗口法对帧间差异值序列进行分析,计算局部峰值位置,得到场景切换候选点;S13、基于每个场景切换候选点的前后帧,采用边缘检测算法,计算边缘分布的相似度,得到场景切换概率值;根据预设的场景切换阈值,筛选场景切换概率值,确定最终的场景切换点;以场景切换点为边界,将连续视频帧数据分割为预定个子序列;对每个子序列计算平均运动矢量幅度,得到运动复杂度指标;基于运动复杂度指标和预设的图像组长度范围,为每个子序列确定最适图像组长度;S14、基于最适图像组长度,将每个子序列分割为预定个图像组;对每个图像组指定第一帧为帧内编码图像帧,其余帧根据预设的编码策略分配为前向预测编码图像帧或双向预测内插帧,形成最终的图像组结构数据。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人中科方寸知微(南京)科技有限公司,其通讯地址为:211135 江苏省南京市江宁区麒麟科技创新园创研路266号人工智能产业园3号楼203B室;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。