一种高连贯性视频合成的稳定扩散模型方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：武汉橡皮膜网络科技有限公司

摘要：本发明公开了一种高连贯性视频合成的稳定扩散模型方法，涉及视频合成技术领域，现提出如下方案，包括以下步骤：S1、数据输入：首先接收文本输入作为视频语义级别的内容条件，然后通过CLIP的交叉注意力机制控制基础模型和精修模型的生成，同时接收镜头、姿势和位置等作为视频细节相关的具体条件，将所有具体条件作为多个控制模型的输入；本发明保证视频的连贯性和一致性，针对高视效、高连贯性的视频，通过在精修模型更多的关注视频序列中的运动信息，从而生成更平滑和稳定的中间帧，生成更清晰和逼真的视频，有效地利用输入的条件来控制视频的内容和风格，让整体模型更加稳定和鲁棒，可靠地生成高质量的视频，有趣地生成不同的视频效果。

主权项：1.一种高连贯性视频合成的稳定扩散模型方法，其特征在于，包括以下步骤：S1、数据输入：首先接收文本输入作为视频语义级别的内容条件，通过CLIP和交叉注意力机制控制基础模型和精修模型的生成，同时接收镜头、姿势和位置作为视频细节相关的具体条件，将所有具体条件作为多个控制模型的输入，然后通过交叉注意力机制控制基础模型和精修模型的生成；S2、关键帧潜在变量生成：使用基础模型从条件生成一系列的关键帧潜在变量；S3、视频帧潜在变量生成：使用精修模型从关键帧潜在变量以及条件生成一系列的连续视频帧潜在变量；S4、视频序列输出：将视频帧潜在变量转换到像素空间，输出视频序列；所述基础模型是基于潜在扩散的文生图模型，该模型能够根据内容条件和具体条件从随机生成的潜在变量生成具有一定连贯性的关键帧潜在变量；所述精修模型是基于扩散的图生视频模型，它与基础模型在同一潜空间中训练，该模型能够根据所述基础模型生成的关键帧潜在变量以及内容条件和具体条件进一步从随机生成的潜在变量中生成高连贯性的视频帧潜在变量；所述基础模型与精修模型的关键帧与视频帧潜在变量是通过从噪声的逆向扩散过程生成的，所述基础模型与精修模型使用与稳定扩散模型的相同的框架并从原始稳定扩散模型中继承了权重，但是额外附加了时间注意力层，所述基础模型与精修模型利用原始稳定扩散模型的预训练图像特征建模能力，得到初始化良好的特征；所述控制模型使用镜头、姿势或风格对生成内容进行精细化控制，所述控制模型使用零卷积去噪的U-Net中引入了额外的控制特征，同时根据控制条件是否包含时间属性额外添加时间注意力层，让控制模型同时关注视频的时间与空间维度，利用扩散过程的潜在空间来实现视频之间的变形和过渡；所述控制模型由多个模型组成，每个模型用于控制视频生成的某个具体要素，包括视频的镜头移动、人物动作或风格滤镜，控制模型采用了与去噪U-Net的下采样部分相同的框架。

全文数据：

权利要求：

百度查询：武汉橡皮膜网络科技有限公司一种高连贯性视频合成的稳定扩散模型方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种基于IP6加密生成地址系统

下一篇：服务器拓展模组、服务器、配置方法、设备及介质

相关技术

一种基于IP6加密生成地址系统

服务器拓展模组、服务器、配置方法、设备及介质

加解密管理方法、服务器、系统、介质

一种装配路径规划方法

生产硬化钢部件的方法

卡读写装置、自动交易系统及自动交易的方法

一种多端口变换器及其紧凑化设计方法

社交网络舆情态势决策方法、装置、设备及介质

多屏显示方法、装置、设备和介质

一种欠驱动无人船自适应滑模轨迹跟踪控制方法

一种自动化的输出电机安装方法

用于混合动力飞行器中DC总线电压的稳定的系统与方法

合成相关技术

用于合成碳化硅粉料的坩埚及合成装置_湖南金博碳基材料研究院有限公司_202323236256.6

语音合成模型的训练方法、语音合成方法及装置_中移(苏州)软件技术有限公司_202410979156.2

固相肽合成洗涤方法_伊莱利利公司_202380021887.X

香豆素合成及其用途_巴斯夫欧洲公司_202380022411.8

一种离子液体催化合成N‐取代噁唑烷‐2‐酮的合成方法_东华理工大学_202410612763.5

一种酶法合成硒酸软骨素的生物合成方法及其应用_浙江农林大学_202410883609.1

合成达格列净的中间体及其制备方法和合成达格列净的方法_常州亚邦制药有限公司_202410878874.0

一种氯乙烯合成装置和乙炔液相催化合成氯乙烯的方法_厦门中科易工化学科技有限公司_202410739806.6

一种左旋烟碱的合成方法_安徽中烟工业有限责任公司_202310255413.3

一种聚砜树脂的合成方法_山东祥龙新材料股份有限公司_202410667424.7

稳定相关技术

一种基于双重稳定包络的车辆稳定性集成控制方法_吉林大学_202410957906.6

一种蒸发管式火焰稳定器和火焰稳定系统_厦门大学_202410914924.6

一种组装稳定的马达_东莞市建益翔电子有限公司_202323671268.1

稳定的抗OSMR抗体制剂_基尼克萨制药有限公司_202410705360.5

颜色稳定的环氧组合物_3M创新有限公司_202380022524.8

全息光学元件与温度稳定化_卡尔蔡司耶拿有限公司_202380016543.X

一种稳定型夹爪_黄石睿智精密机械有限公司_202420249852.3

一种连接稳定的气力输送设备_扬州工业职业技术学院_202411052971.0

胸腔镜手术用稳定器_安徽省胸科医院(省结核病防治研究所)_202323185372.X

一种稳定式电缆牵引装置_湖北永腾电缆集团有限公司_202323416523.8

扩散相关技术

用于锌扩散的装置及锌扩散方法、系统、电子设备及介质_无锡中科德芯感知科技有限公司_202310257732.8

扩散膜片、背光模组及显示设备_茂佳科技(广东)有限公司_202323622764.8

一种防脱落扩散螺丝_浙江美泉紧固件智造有限公司_202420426309.6

一种扩散板的检测装置_南通创亿达新材料股份有限公司_202411180958.3

对流增强扩散性α-发射体辐射疗法_阿尔法陶医疗有限公司_202380022581.6

纺织品的滴水扩散时间测试仪_深圳市瑞锋仪器有限公司_202420297109.5

一种高强度扩散器_杭州蓝卡净化设备有限公司_202420045542.X

配备有具有梳形状的无热扩散冷却结构的电池组_三星SDI株式会社_202410343176.0

太阳能电池及其硼扩散方法、叠层电池、光伏组件_晶科能源(上饶)有限公司_202410840958.5

一种用于固-液相中核素扩散迁移行为研究实验装置_中国辐射防护研究院_202410586238.0

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种高连贯性视频合成的稳定扩散模型方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务