首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于多平面图像学习视角合成的基线扩展实现方法_大连理工大学_202011105754.5 

申请/专利权人:大连理工大学

申请日:2020-10-15

公开(公告)日:2024-06-21

公开(公告)号:CN112233165B

主分类号:G06T7/593

分类号:G06T7/593;G06T15/04;G06T15/10;G06N3/0499;G06N3/08

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2021.02.02#实质审查的生效;2021.01.15#公开

摘要:本发明公开了一种基于多平面图像学习视角合成的基线扩展实现方法,用于从窄基线立体摄像机捕获的图像中推断出基线之外的视图。包括:基于视频剪辑获取包括由第一相机采集的第一幅图像和由第二相机采集的第二幅图像的立体图像对;将第二幅图像投影到第一相机坐标系下的一组深度平面上,计算平面扫描量,得到重新投影的图像;将重新投影的图像沿着颜色通道级联,再将张量与第一幅图像级联,得到输入张量;将输入张量输入训练好的基于深度神经网络的MPI学习网络,得到多平面图像MPI的RGBA分层表示;基于MPI的RGBA分层表示,合成同一场景的输入视图之外的视图。本发明在扩展窄基线立体图像方面具有良好的应用前景,并能对许多具有挑战性的场景获得准确的推理结果。

主权项:1.一种基于多平面图像学习视角合成的基线扩展实现方法,其特征在于,包括以下步骤:步骤1、基于视频剪辑获取立体图像对;所述立体图像对包括由第一相机采集的第一幅图像I1和由第二相机采集的第二幅图像I2;步骤2、将所述第二幅图像I2重新投影到所述第一相机的坐标系下的一组固定深度平面上,计算平面扫描量,得到重新投影的图像表示I2重新投影到I1视角下深度为D的平面上的图像;步骤3、将所述重新投影的图像沿着颜色通道级联,得到维度为H×W×3D的张量再将所述张量与所述第一幅图像级联,得到维度为H×W×3D+1的输入张量;其中,H和W表示投影图像的长和宽,D表示深度;步骤4、将所述输入张量输入训练好的基于深度神经网络的MPI学习网络,得到多平面图像MPI的RGBA分层表示;步骤5、基于MPI的RGBA分层表示,合成同一场景的输入视图之外的视图。

全文数据:

权利要求:

百度查询: 大连理工大学 一种基于多平面图像学习视角合成的基线扩展实现方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。