Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 IP管家助手 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜福建帝视信息科技有限公司陈弘林获国家专利权

恭喜福建帝视信息科技有限公司陈弘林获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜福建帝视信息科技有限公司申请的专利一种基于神经网络的通用视频时域对齐方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN112819743B

龙图腾网通过国家知识产权局官网在2025-04-25发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202110169802.5,技术领域涉及:G06T5/60;该发明授权一种基于神经网络的通用视频时域对齐方法是由陈弘林;李茹;谢军伟;童同;高钦泉;罗鸣设计研发完成,并于2021-02-08向国家知识产权局提交的专利申请。

一种基于神经网络的通用视频时域对齐方法在说明书摘要公布了:本发明提供了一种基于神经网络的通用视频时域对齐方法,包括步骤:采集当前视频所有的原视频图像帧;将原视频图像帧经由一图像处理神经网络模型处理后得到处理图像帧;构建可以用于对齐视频图像帧间时域的深度卷积神经网络;采用所述原视频图像帧及所述处理图像帧作为输入,通过所述深度卷积神经网络,获得输出的时域对齐的视频图像帧;合成所述输出的时域对齐的视频图像帧,得到最终时域对齐的完整视频。本发明解决了由直接应用图像处理模型到视频任务产生的视频时域不一致问题的问题,具有用一个通用算法解决多种不同视频任务的时域不一致问题的优点。

本发明授权一种基于神经网络的通用视频时域对齐方法在权利要求书中公布了:1.一种基于神经网络的通用视频时域对齐方法,其特征在于,包括以下步骤:采集当前视频所有的原视频图像帧;将原视频图像帧经由一图像处理神经网络模型处理后得到处理图像帧;构建可以用于对齐视频图像帧间时域的深度卷积神经网络;采用所述原视频图像帧及所述处理图像帧作为输入,通过所述深度卷积神经网络,获得输出的时域对齐的视频图像帧;合成所述输出的时域对齐的视频图像帧,得到最终时域对齐的完整视频;所述用于对齐视频图像帧间时域的深度卷积神经网络为整合了ConvLSTM卷积长短期记忆单元层的U-Net图像变换网络;所述U-Net图像变换网络为编码器-解码器架构,包含四次下采样及四次上采样操作,形成一个U型结构;进行第四次下采样操作后,接入一个ConvLSTM卷积长短期记忆单元层,然后再进行上采样操作;所述采用所述原视频图像帧及所述处理图像帧作为输入,通过所述深度卷积神经网络,获得输出的时域对齐的视频图像帧具体为:当t为第一帧时,设定t-1=t,t-2=t;当t为第二帧时,设定t-1=t;当t为最后一帧时,设定t+1=t;对于第t原视频图像帧,同时取第t-1原视频图像帧、第t-1处理图像帧、第t原视频图像帧和第t处理图像帧作为输入,通过所述深度卷积神经网络得到初步时域稳定的第t对齐图像帧;计算所述第t处理图像帧及所述第t对齐图像帧的监督学习训练函数;对于第t-1原视频图像帧,同时取第t-2原视频图像帧、第t-2处理图像帧、第t-1原视频图像帧和第t-1处理图像帧作为输入,通过所述深度卷积神经网络得到初步时域稳定的第t-1对齐图像帧,计算所述第t-1处理图像帧及所述第t-1对齐图像帧的监督学习训练函数;对于第t+1原视频图像帧,同时取第t原视频图像帧、第t处理图像帧、第t+1原视频图像帧和第t+1处理图像帧作为输入,通过所述深度卷积神经网络得到初步时域稳定的第t+1对齐图像帧,计算所述第t+1处理图像帧及所述第t+1对齐图像帧的监督学习训练函数;将所述计算得到的第t-1处理图像帧及第t-1对齐图像帧的监督学习训练函数、第t处理图像帧及第t对齐图像帧的监督学习训练函数和第t+1处理图像帧及第t+1对齐图像帧的监督学习训练函数以1:1:1的比例进行相加得到最终用于优化处理第t原视频图像帧的所述深度卷积神经网络的总监督学习训练函数;所述监督学习训练函数包括感知损失函数、结构相似性损失函数以及总训练函数;感知损失函数如下: 式中,下标j表示网络的第j层,CjHjWj表示第j层特征图的大小;损失网络使用VGG-19预训练网络,用φ表示网络;y表示处理图像帧,表示对齐图像帧;结构相似性损失函数如下: 式中,x,y分别代表处理图像帧及对齐图像帧,μx和μy分别代表x,y的平均值,和分别代表x,y的方差,σxy代表x和y的协方差,c1,c2分别为常数;总训练函数为:L=Lt-1+Lt+Lt+1;其中,Lt代表第t处理图像帧与第t对齐图像帧间的损失函数,表示如下: 式中,表示感知损失函数,表示结构相似性损失函数,表示第t对齐图像帧,yt表示第t处理图像帧;将L最终用于优化所述深度卷积神经网络的总监督训练函数。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人福建帝视信息科技有限公司,其通讯地址为:350002 福建省福州市鼓楼区西洪路528号云座2号楼5楼B区;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。