买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:山东浪潮超高清智能科技有限公司
摘要:本发明公开了一种基于大模型的老胶片影像修复补帧方法,涉及AI影像修复技术领域。本发明包括胶片物理清洁修复、胶片数字化扫描、影像高清修复、大模型补帧和视频合成打包;利用大模型AIGC图像生成技术对破损严重、丢失的图像帧进行替换补充、提高视频流畅度。大模型以VAEEncoder作为基础图像特征器、transformer为图像生成器,并引入运动模块和注意力机制提升生成质量。可有效处理非匀速、有遮挡等情况,提升效果。具有准确率高,速度快,成本低的效果。
主权项:1.一种基于大模型的老胶片影像修复补帧方法,其特征在于,包括胶片物理清洁修复、胶片数字化扫描、影像高清修复、大模型补帧和视频合成打包;胶片物理清洁修复;对胶片片孔和接头进行检查和物理修复;胶片数字化扫描;清洁后的胶片通过胶片扫描系统直接以4K或8K格式的DPX图片序列格式扫描,同时对胶片画面旁边的音轨进行光学扫描记录,转换之后以无压缩声音文件共同且相对应地保存至数字化制作存储中;影像高清修复;使用半自动修复工具和人工校正,修复画面中的脏点、划痕、竖线、抖动、闪烁和噪点问题;修复完成还需要进行调色,使用图像数字调色系统校准色温、对比度、饱和度内容,使图像达到4K8K标准的色域级别与色彩空间要求;大模型补帧;大模型以变分自动编码器VAEEncoder作为基础的图像特征提取器,该提取器将一组视频帧分成几个部分,,该组视频帧同时包括前后帧,每个部分分别进行编码,充分整合影片时序信息;具体步骤包括,VAE从视频帧中提取Tokens,即图像中具有语义的局部小单位以及位置编码,然后用transforms模块进一步对Tokens进行细粒度更高的编码,最后通过正则变换层LayerNorm以及线性变换,得到低维的图像特征向量;提取到了前后帧的低维特征编码之后输入到基于transformer的扩散式图像生成器中,生成新的视频帧;扩散式图像生成器会首先生成一张低分辨率噪声图像,然后使用特征编码以及比对前后帧,逐步去除噪声;引入注意力机制,充分关注连续帧中的动态部分,即对图片的位置赋予权重系数,通过模型训练,提升图片运动位置的权重,减小图片静态位置的权重;视频合成打包;将修复补帧完成画面和声音文件进行声画合成,生成4K8K母版并进行非线性编辑,合成完整影片。
全文数据:
权利要求:
百度查询: 山东浪潮超高清智能科技有限公司 一种基于大模型的老胶片影像修复补帧方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。