首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于视频内容理解的视频增强方法及系统 

申请/专利权人:华南理工大学

申请日:2024-04-11

公开(公告)日:2024-06-28

公开(公告)号:CN118037549B

主分类号:G06T3/4053

分类号:G06T3/4053;G06T3/4007;G06T3/10;G06V20/40;G06V10/25

优先权:

专利状态码:有效-授权

法律状态:2024.06.28#授权;2024.05.31#实质审查的生效;2024.05.14#公开

摘要:本发明公开了一种基于视频内容理解的视频增强方法及系统,涉及视频处理技术,针对现有技术中超分处理资源分配不合理的问题提出本方案。通过用户输入的关键物体文本识别低清视频中的关键区域和非关键区域,并对不同区域进行对应的超分辨率重建以得到高清视频;其中,对非关键区域进行插值重建,对关键区域进行深度学习重建。优点在于,结合简单高效的传统插值算法和效果优异的深度学习超分技术,根据用户输入的偏好文本识别并划分出视频中的关键区域和非关键区域。避免了对于完整区域进行基于深度学习超分而造成的过度处理和资源浪费、以及完全使用插值算法而效果不佳的问题。在实现超分视觉效果的前提下,节省了资源消耗以及处理时间。

主权项:1.一种基于视频内容理解的视频增强方法,其特征在于,通过用户输入的关键物体文本识别低清视频中的关键区域和非关键区域,并对不同区域进行对应的超分辨率重建以得到高清视频;其中,对非关键区域进行插值重建,对关键区域进行深度学习重建;具体包括以下步骤:S100:将待增强的低清视频进行逐帧裁切处理,得到低清图像序列帧;S200:获取用户输入的关键物体文本;S300:根据关键物体文本识别出低清图像序列帧的关键区域和非关键区域;S400:将关键区域输入视频超分网络得到关键区域超分结果;S500:对非关键区域利用插值算法得到非关键区域超分结果;S600:逐帧对关键区域超分结果和非关键区域超分结果进行融合;S700:将融合后的超分图像序列帧转化为视频,得到所述高清视频;在所述步骤S300中,将低清图像序列帧以及关键物体文本输入至基于语言引导的开集目标检测器网络中,输出得到与低清视频逐帧对应的包含关键物体的矩形边界框;矩形边界框内的区域为关键区域,矩形边界框以外的区域为非关键区域;在所述步骤S400中,将低清图像序列帧中的每N帧为一组进行分组;在每组低清图像序列帧中遍历N帧图像内的关键区域矩形边界框,找到完全包含此N个矩形边界框的最小矩形边界框;利用所述最小矩形边界框对当前组内的N帧图像序列进行裁剪;将剪后的每组低清图像序列帧输入至视频超分网络中得到所述关键区域超分结果;在所述步骤S600中,根据上采样倍数得到插值上采样图像中的关键区域位置;然后,逐帧将超分辨率重建后的关键区域图像加权融合至所述插值上采样图像的关键区域位置,得到融合后的超分图像序列帧;加权融合采用渐变平滑加权融合算法;渐变平滑加权融合是指在对插值上采样图像中关键区域位置图像和关键区域超分后图像进行融合时,设定过渡距离为N个像素;从关键区域边界往中心方向至过渡边界处逐渐增加关键区域超分后图像的融合权重,越靠近关键区域边界,其权重值越小、越接近0,越靠近过渡边界处,其权重值越大、越接近1,而过渡边界处至关键区域中心处的融合权重全部为1;设定第帧插值上采样图像为,经视频超分网络输出的第帧关键区域图像为,第帧低清图像的关键区域表示为,则在上采样后根据上采样倍数,第帧插值上采样图像中关键区域位置图像可表示为;设定关键区域超分后图像的融合权重所组成的权重矩阵为,则第帧的输出融合图像通过以下方式得到: ; ;其中表示逐像素点运算。

全文数据:

权利要求:

百度查询: 华南理工大学 一种基于视频内容理解的视频增强方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。