首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】文本屏幕内容视频通用视频编码标准的率失真优化方法_陕西师范大学_202410271033.3 

申请/专利权人:陕西师范大学

申请日:2024-03-11

公开(公告)日:2024-06-07

公开(公告)号:CN118158416A

主分类号:H04N19/147

分类号:H04N19/147;H04N19/19;H04N19/567;H04N19/577

优先权:

专利状态码:在审-公开

法律状态:2024.06.07#公开

摘要:一种文本屏幕内容视频通用视频编码标准的率失真优化方法,由确定文本屏幕内容视频图像帧差均值、确定文本屏幕内容视频图像运动类型、对文本屏幕内容视频运动分类、估计平坦类视频的拉格朗日因子、对通用视频编码标准的率失真优化步骤组成。由于本发明采用了对文本屏幕内容视频运动分类步骤,解决了现有技术没有考虑文本屏幕内容视频的运动特性问题,采用了估计平坦类视频的拉格朗日因子、对文本屏幕内容视频通用视频编码标准率失真优化步骤,解决了传统视频编码率失真优化方法效率低问题。本发明具有编码效率高、计算简单等优点,可用于H.266VVC标准的文本类屏幕内容视频率失真优化技术领域。

主权项:1.一种文本屏幕内容视频通用视频编码标准的率失真优化方法,其特征在于由下述步骤组成:1确定文本屏幕内容视频图像帧差均值获取通用测试条件中的文本屏幕内容视频,采用确定图像帧差均值方法,按式1确定文本屏幕内容视频图像帧差均值 Mni,j=|Oni,j-On-1i,j|其中,W为视频图像的帧宽,H为视频图像的帧高,Mni,j表示第n幅视频图像与前一幅视频图像第i行第j列像素值的绝对值差,Oni,j表示第n幅视频图像第i行第j列像素值;2确定文本屏幕内容视频图像运动类型按式2确定文本屏幕内容视频图像运动类型A: 其中,1表示图像为运动类型,0表示图像为静止类型,a1为图像运动类型的阈值参数;3对文本屏幕内容视频运动分类1确定视频连续运动比例从输入视频的第1帧开始,统计视频连续6帧视频图像运动类型A为1的总帧数,按式3确定视频连续运动比例Ps: 其中,Ns为连续运动视频总帧数,Nv为视频总帧数;2对文本屏幕内容视频运动分类按式4对文本屏幕内容视频运动分类B: 其中,1表示视频为平坦类文本屏幕内容视频,0表示视频为分级类文本屏幕内容视频,a2为视频运动分类的阈值参数;4估计平坦类视频的拉格朗日因子采用优化的模拟退火方法估计平坦类视频的拉格朗日因子,该方法包括如下步骤:1确定初始温度按式5确定初始温度T: V=meanstd[Oni,j-On-1i,j]其中,clip·表示限制在ε1,ε2之间,ε1表示最小值,ε2表示最大值,m1、m2、m3为参数,V表示视频帧差标准差的平均值,mean·表示确定均值,std[·]表示确定标准差;2确定初始拉格朗日因子估计值按式6确定初始拉格朗日因子估计值λ1z: 其中,λmax表示拉格朗日因子估计最大值,γ表示拉格朗日因子下降最大值,random·表示产生随机数,QP为编码量化参数,k1、k2、q1、q2为参数;3预编码视频获取编码数据采用VTM-16.2软件预编码视频,编码帧数至少为9帧,编码结构为低时延编码结构,预编码视频的量化参数为4个非连续的正整数,取值范围为[1,63],该视频的其他编码参数与文件encoder_lowdelay_vtm.cfg相同,获取4组编码数据,D0是获取的时间0层平均码率,λ0是获取的时间0层拉格朗日因子,R0是获取的时间0层平均失真,r1、t1、h1是公式参数;采用最小二乘法按式7进行曲线拟合确定r1、t1、h1:R1=r1Inλ12+t1Inλ1+h17其中,R1是获取的时间1层平均码率,λ1是获取的时间1层拉格朗日因子;4确定拉格朗日因子迭代值按式8确定拉格朗日因子迭代值 其中,λmin表示拉格朗日因子估计最小值;5确定率失真代价差按式9确定率失真代价差ΔJ: J0=D0+λ0R0 其中,表示拉格朗日因子迭代值的率失真代价,表示拉格朗日因子估计值的率失真代价,J0表示时间0层的率失真代价,NL表示视频时间层总数,NL为有限的正整数,Nx表示第x个时间层的图像帧数,x∈[1,NL-1],为拉格朗日因子迭代值的码率,为使用拉格朗日因子估计值的码率;6更新拉格朗日因子估计值按式10更新拉格朗日因子估计值 7确定模拟退火温度按式11确定模拟退火温度T:T=T×η11其中,η为降温系数;8获取平坦类视频的拉格朗日因子估计值迭代步骤3-6至温度T10℃,得到平坦类视频的拉格朗日因子估计值5对通用视频编码标准的率失真优化采用VTM-16.2软件编码视频,对视频进行率失真优化,编码结构为低时延双向参考帧和低延时向前参考帧编码结构,该视频的其他编码参数与文件encoder_lowdelay_vtm.cfg和encoder_lowdelay_P_vtm.cfg相同,对分级类视频直接采用VTM-16.2软件中的原始拉格朗日因子进行编码率失真优化,平坦类视频时间0层采用VTM-16.2软件中的原始拉格朗日因子进行编码率失真优化,其余时间层采用步骤4估计平坦类视频的拉格朗日因子进行编码率失真优化,完成对文本屏幕内容视频通用视频编码标准的率失真优化。

全文数据:

权利要求:

百度查询: 陕西师范大学 文本屏幕内容视频通用视频编码标准的率失真优化方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。