首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

以对象为中心的高效新视图合成的无几何神经场景表示 

申请/专利权人:谷歌有限责任公司

申请日:2022-11-15

公开(公告)日:2024-06-25

公开(公告)号:CN118251699A

主分类号:G06T15/20

分类号:G06T15/20;G06N3/0455;G06N3/088

优先权:["20211116 US 63/279,875","20220519 US 63/343,882"]

专利状态码:在审-公开

法律状态:2024.06.25#公开

摘要:提供了通过以对象为中心的高效新视图合成来生成无几何神经场景表示的机器学习模型。具体地,本公开的一个示例方面提供了一种新框架,其中编码器模型例如,编码器Transformer网络处理具有或不具有姿态的一个或多个RGB图像以产生可以传递给解码器模型例如,解码器Transformer网络的完全潜在场景表示。鉴于一个或多个目标姿态,解码器模型可以在单次正向传递中合成图像。在一些示例实现方式中,因为使用了Transformer而不是卷积或MLP网络,所以编码器可以学习注意力模型,该注意力模型从一小组图像中提取关于场景的足够的3D信息,以在无需显式几何的情况下渲染具有正确投影、视差、遮挡、以及甚至语义的新视图。

主权项:1.一种用于更高效地生成场景的新视图的计算机实现的方法,所述方法包括:由包括一个或多个计算装置的计算系统获得描绘场景的一个或多个输入图像;由所述计算系统分别为所述一个或多个输入图像生成一个或多个图像嵌入;由所述计算系统利用机器学习编码器模型来处理所述一个或多个图像嵌入以生成表示所述场景的场景嵌入;由所述计算系统获得描述用于所述场景的预测图像的一次或多次射线投射的射线数据;由所述计算系统利用机器学习解码器模型来处理所述场景嵌入和所述射线数据以生成用于所述场景的所述预测图像的所述一次或多次射线投射的合成图像数据;以及由所述计算系统提供所述场景的所述预测图像作为输出。

全文数据:

权利要求:

百度查询: 谷歌有限责任公司 以对象为中心的高效新视图合成的无几何神经场景表示

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。