一种基于视频内容理解的视频增强方法及系统

导航：龙图腾网> 最新专利技术> 一种基于视频内容理解的视频增强方法及系统

申请/专利权人：华南理工大学

申请日：2024-04-11

公开（公告）日：2024-06-28

公开（公告）号：CN118037549B

主分类号：G06T3/4053

分类号：G06T3/4053;G06T3/4007;G06T3/10;G06V20/40;G06V10/25

优先权：

专利状态码：有效-授权

法律状态：2024.06.28#授权;2024.05.31#实质审查的生效;2024.05.14#公开

摘要：本发明公开了一种基于视频内容理解的视频增强方法及系统，涉及视频处理技术，针对现有技术中超分处理资源分配不合理的问题提出本方案。通过用户输入的关键物体文本识别低清视频中的关键区域和非关键区域，并对不同区域进行对应的超分辨率重建以得到高清视频；其中，对非关键区域进行插值重建，对关键区域进行深度学习重建。优点在于，结合简单高效的传统插值算法和效果优异的深度学习超分技术，根据用户输入的偏好文本识别并划分出视频中的关键区域和非关键区域。避免了对于完整区域进行基于深度学习超分而造成的过度处理和资源浪费、以及完全使用插值算法而效果不佳的问题。在实现超分视觉效果的前提下，节省了资源消耗以及处理时间。

主权项：1.一种基于视频内容理解的视频增强方法，其特征在于，通过用户输入的关键物体文本识别低清视频中的关键区域和非关键区域，并对不同区域进行对应的超分辨率重建以得到高清视频；其中，对非关键区域进行插值重建，对关键区域进行深度学习重建；具体包括以下步骤：S100：将待增强的低清视频进行逐帧裁切处理，得到低清图像序列帧；S200：获取用户输入的关键物体文本；S300：根据关键物体文本识别出低清图像序列帧的关键区域和非关键区域；S400：将关键区域输入视频超分网络得到关键区域超分结果；S500：对非关键区域利用插值算法得到非关键区域超分结果；S600：逐帧对关键区域超分结果和非关键区域超分结果进行融合；S700：将融合后的超分图像序列帧转化为视频，得到所述高清视频；在所述步骤S300中，将低清图像序列帧以及关键物体文本输入至基于语言引导的开集目标检测器网络中，输出得到与低清视频逐帧对应的包含关键物体的矩形边界框；矩形边界框内的区域为关键区域，矩形边界框以外的区域为非关键区域；在所述步骤S400中，将低清图像序列帧中的每N帧为一组进行分组；在每组低清图像序列帧中遍历N帧图像内的关键区域矩形边界框，找到完全包含此N个矩形边界框的最小矩形边界框；利用所述最小矩形边界框对当前组内的N帧图像序列进行裁剪；将剪后的每组低清图像序列帧输入至视频超分网络中得到所述关键区域超分结果；在所述步骤S600中，根据上采样倍数得到插值上采样图像中的关键区域位置；然后，逐帧将超分辨率重建后的关键区域图像加权融合至所述插值上采样图像的关键区域位置，得到融合后的超分图像序列帧；加权融合采用渐变平滑加权融合算法；渐变平滑加权融合是指在对插值上采样图像中关键区域位置图像和关键区域超分后图像进行融合时，设定过渡距离为N个像素；从关键区域边界往中心方向至过渡边界处逐渐增加关键区域超分后图像的融合权重，越靠近关键区域边界，其权重值越小、越接近0，越靠近过渡边界处，其权重值越大、越接近1，而过渡边界处至关键区域中心处的融合权重全部为1；设定第帧插值上采样图像为,经视频超分网络输出的第帧关键区域图像为，第帧低清图像的关键区域表示为，则在上采样后根据上采样倍数，第帧插值上采样图像中关键区域位置图像可表示为；设定关键区域超分后图像的融合权重所组成的权重矩阵为，则第帧的输出融合图像通过以下方式得到：；；其中表示逐像素点运算。

全文数据：

权利要求：

百度查询：华南理工大学一种基于视频内容理解的视频增强方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：自穿刺铆钉、电池及用电设备

下一篇：一种口腔扩张支撑装置

相关技术

自穿刺铆钉、电池及用电设备

一种口腔扩张支撑装置

一种移动式自填充胶枪

一种高效物流包装码垛装置

一种互动茶几安全防护围挡

一种墙面保护用裁边边压片

一种锂电池外壳冲压设备

建筑工程管理招标装置

用于车辆顶板的显示装置和车辆

一种高层建筑双水系统分布式空调热交换装置

一种基于防潮功能的变频器控制箱

一种电表排母接口测量装置

理解相关技术

一种基于视频内容理解的视频增强方法及系统_华南理工大学_202410430364.7

用于接合的热管理解决方案的远程机械附接_英特尔公司_202311278060.5

一种3D场景理解方法、系统、电子设备及存储介质_上海人工智能创新中心_202211673985.5

基于跨语言表示学习的语义理解方法及装置_中国科学院新疆理化技术研究所_202410332204.9

一种基于大语言模型和视频理解的模仿学习方法_浙江工业大学_202410428393.X

机器阅读理解模型、机器阅读理解方法、装置及设备_中移雄安信息通信科技有限公司_202410402416.X

对话理解方法、装置、可读介质及电子设备_北京有竹居网络技术有限公司_202011227571.0

基于特征点法视觉SLAM的场景理解导航方法及系统_常熟理工学院_202410317058.2

一种基于自动构建提示工程的自然语言理解方法及系统_佛山科学技术学院_202410170010.3

一种基于结构化场景理解的目标导航方法及装置_北京科技大学_202410181460.2

增强相关技术

增强现实设备_OPPO广东移动通信有限公司_202211673263.X

增强现实设备_OPPO广东移动通信有限公司_202211673416.0

增强体增强铝基复合材料及其制备方法_比亚迪股份有限公司_202211695620.2

利用空间音频提示增强控件声音_苹果公司_202010374387.2

增强随机接入的通信系统_几维通信技术(深圳)股份有限公司_202210433497.0

结构增强型云母片_东莞市硅翔绝缘材料有限公司_202322929823.X

UE组的时间同步增强_诺基亚技术有限公司_201980053723.9

增强型定位参考信号处理_高通股份有限公司_202280076893.0

可寻址的增强现实内容_斯纳普公司_202080047875.0

页面图像增强方法及装置_上海哔哩哔哩科技有限公司_202410497407.3

方法相关技术

编译方法、运行方法及相关产品_中科寒武纪科技股份有限公司_202211700640.4

参数控制方法以及曝光方法_上海交通大学_202410383008.4

测试单元及形成方法、测试结构及形成方法、测试方法_中芯国际集成电路制造(上海)有限公司_202211698757.3

预测模型生成方法、预测方法、设备和介质_博泰车联网科技(上海)股份有限公司_202211724925.1

获取方法、训练方法、任务处理方法及相关装置_浙江大华技术股份有限公司_202410693597.6

掩模图像生成方法、检查方法以及检查装置_日立安斯泰莫株式会社_202280076511.4

水文模型结构诊断方法、径流预报方法及装置_武汉大学_202111312143.2

分类模型训练方法以及分类方法_腾讯科技(深圳)有限公司_202210102315.1

建模方法及利用该建模方法的多类目标签的目标检测方法_小红书科技有限公司_202211695489.X

坏点检测模型训练方法、坏点检测方法以及坏点修复方法_京东方科技集团股份有限公司_202280003858.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于视频内容理解的视频增强方法及系统

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务