以对象为中心的高效新视图合成的无几何神经场景表示

导航：龙图腾网> 最新专利技术> 以对象为中心的高效新视图合成的无几何神经场景表示

申请/专利权人：谷歌有限责任公司

申请日：2022-11-15

公开（公告）日：2024-06-25

公开（公告）号：CN118251699A

主分类号：G06T15/20

分类号：G06T15/20;G06N3/0455;G06N3/088

优先权：["20211116 US 63/279,875","20220519 US 63/343,882"]

专利状态码：在审-公开

法律状态：2024.06.25#公开

摘要：提供了通过以对象为中心的高效新视图合成来生成无几何神经场景表示的机器学习模型。具体地，本公开的一个示例方面提供了一种新框架，其中编码器模型例如，编码器Transformer网络处理具有或不具有姿态的一个或多个RGB图像以产生可以传递给解码器模型例如，解码器Transformer网络的完全潜在场景表示。鉴于一个或多个目标姿态，解码器模型可以在单次正向传递中合成图像。在一些示例实现方式中，因为使用了Transformer而不是卷积或MLP网络，所以编码器可以学习注意力模型，该注意力模型从一小组图像中提取关于场景的足够的3D信息，以在无需显式几何的情况下渲染具有正确投影、视差、遮挡、以及甚至语义的新视图。

主权项：1.一种用于更高效地生成场景的新视图的计算机实现的方法，所述方法包括：由包括一个或多个计算装置的计算系统获得描绘场景的一个或多个输入图像；由所述计算系统分别为所述一个或多个输入图像生成一个或多个图像嵌入；由所述计算系统利用机器学习编码器模型来处理所述一个或多个图像嵌入以生成表示所述场景的场景嵌入；由所述计算系统获得描述用于所述场景的预测图像的一次或多次射线投射的射线数据；由所述计算系统利用机器学习解码器模型来处理所述场景嵌入和所述射线数据以生成用于所述场景的所述预测图像的所述一次或多次射线投射的合成图像数据；以及由所述计算系统提供所述场景的所述预测图像作为输出。

全文数据：

权利要求：

百度查询：谷歌有限责任公司以对象为中心的高效新视图合成的无几何神经场景表示

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种奶牛饲料生产用研磨装置

下一篇：一种具有固定结构的快客杯

相关技术

一种奶牛饲料生产用研磨装置

一种具有固定结构的快客杯

铠甲式轮胎保护链

用于车辆顶板的显示装置和车辆

一种带支架的手把及设有该手把的行李箱

一种无纺布绑袋

一种羊毛毡制作用压实机

一种护理液调和储存罐

一种两级压缩螺杆式空压机壳体

一种模具加工用定位装置

一种便于移动的展开式箱房

一种装配式铝方通转角拼接结构

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

以对象为中心的高效新视图合成的无几何神经场景表示

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务