首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

经由多模态条件的视频合成 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:斯纳普公司

摘要:一种多模态视频生成框架MMVID,其受益于联合地或单独地作为输入提供的文本和图像。视频的量化表示与具有多个模态的双向转换器一起用作预测离散视频表示的输入。使用利用自学习训练的新视频令牌和用于对视频令牌进行采样的改进的掩模预测算法来改进视频质量和一致性。文本增强被用来提高文本表示的鲁棒性和生成的视频的多样性。框架结合不同视觉模态,诸如分割掩模、绘图和部分遮挡的图像。此外,MMVID提取由文本提示建议的视觉信息。

主权项:1.一种条件视频合成方法,所述方法包括:访问多模态视频生成框架MMVID,所述MMVID包括预训练的自动编码器、语言模型、掩模预测算法和预训练的双向转换器;接收多模态输入信号;以及通过将所述MMVID应用于所述多模态输入信号来生成时间上一致的视频。

全文数据:

权利要求:

百度查询: 斯纳普公司 经由多模态条件的视频合成

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术