一种基于扩散模型对应关系的视频编辑方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：清华大学深圳国际研究生院

摘要：一种基于扩散模型对应关系的视频编辑方法，包括以下步骤：S1.使用变分自编码器VAE对输入视频的每一帧提取潜在特征；S2.在提取的潜在特征中加入特定时间步的噪声；S3.将加入噪声后的潜在特征输入到预训练的文本到图像T2I扩散模型中；S4.在T2I扩散模型中执行逆向去噪过程，逐步去除噪声；S5.在逆向去噪过程中提取中间特征表示，形成扩散特征，扩散特征含有每一帧中的标记；S6.计算不同帧之间的扩散特征标记的相似度，以识别出每一帧中标记与其他帧中标记的对应关系；S7.根据识别出的对应关系，对识别出的对应标记进行特征融合，对融合之后的特征进行基于自注意力机制的视频编辑操作。本发明能够显著提高视频编辑的质量和时间一致性。

主权项：1.一种基于扩散模型对应关系的视频编辑方法，其特征在于，包括以下步骤：S1.使用变分自编码器VAE对输入视频的每一帧提取潜在特征；S2.在提取的潜在特征中加入特定时间步的噪声；S3.将加入噪声后的潜在特征输入到预训练的文本到图像T2I扩散模型中；S4.在所述T2I扩散模型中执行逆向去噪过程，逐步去除噪声；S5.在所述逆向去噪过程中提取中间特征表示，形成扩散特征，所述扩散特征含有每一帧中的标记；S6.计算不同帧之间的扩散特征标记的相似度，以识别出每一帧中标记与其他帧中标记的对应关系；S7.根据识别出的对应关系，对识别出的对应标记进行特征融合，并对融合之后的特征进行基于自注意力机制的视频编辑操作。

全文数据：

权利要求：

百度查询：清华大学深圳国际研究生院一种基于扩散模型对应关系的视频编辑方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：连接器和电子设备

下一篇：一种高效快照压缩视频字幕生成方法

相关技术

连接器和电子设备

一种高效快照压缩视频字幕生成方法

一种潮气量检测系统及装置

一种可对球阀均匀喷漆的球阀喷漆装置及喷漆工艺

折边装置、折边系统及折边方法

一种缺陷检测方法和相关设备

一种像控点坐标生成方法、系统、设备及存储介质

计及电池寿命的电热氢混合储能系统容量优化配置方法

一种桩基注浆用浆料搅拌设备

一种充油海缆的防扩裂导油装置

无线信道模型的更新方法、装置、设备及存储介质

线条体固定部件、线条体增设用固定部件以及线条体安装方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于扩散模型对应关系的视频编辑方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务