恭喜云南师范大学刘佳涛获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网恭喜云南师范大学申请的专利一种基于深度学习的室内场景单目图像深度估计方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114638870B 。
龙图腾网通过国家知识产权局官网在2025-05-13发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210251724.8,技术领域涉及:G06T7/50;该发明授权一种基于深度学习的室内场景单目图像深度估计方法是由刘佳涛;张亚萍设计研发完成,并于2022-03-15向国家知识产权局提交的专利申请。
本一种基于深度学习的室内场景单目图像深度估计方法在说明书摘要公布了:本发明涉及一种基于深度学习的室内场景单目图像深度估计方法,属于三维场景感知技术领域。本发明首先引入在ImageNet上作图像分类预训练的神经网络EfficientNet‑b7,构造编码器,在在编码器的不同阶段上,引入基于SENet的残差连接以及卷积和重采样的计算操作,然后基于深度区间划分的思想,构造一个关注于图像全局到局部的损失函数,应用到不同阶段的预测上,得到在不同阶段的预测,最后使用基于自注意力机制的Transformer结构,将不同阶段预测的深度信息进行融合后输出场景深度预测结果。本发明通过设计一个新型、高效且轻量的解码器,将传统的串行融合编码器不同阶段的特征改进为并行融合,提高了模型进行深度估计时对于图像的全局与局部信息的综合利用能力。
本发明授权一种基于深度学习的室内场景单目图像深度估计方法在权利要求书中公布了:1.一种基于深度学习的室内场景单目图像深度估计方法,其特征在于:Step1:引入在ImageNet上作图像分类预训练的神经网络EfficientNet-b7,构造编码器;Step2:在编码器的不同阶段上,引入基于SENet的残差连接以及卷积和重采样的计算操作,得到在不同阶段的预测;Step3:基于深度区间划分的方法,构造一个关注于图像全局到局部的损失函数,应用到不同阶段的预测上;Step4:使用基于自注意力机制的Transformer结构,将不同阶段预测的深度信息进行融合后输出场景深度预测结果;所述Step1具体为:从互联网上下载好在ImageNet上预训练的EfficientNet-b7网络,获得其在第3、5、6、8、12个块编码的特征向量,这些特征向量的分辨率分别是输入图像分辨率的所述Step2具体为:Step2.1:将第3个块编码的特征向量输入到4个基于SENet的残差块中,第5个块编码的特征向量输入到3个基于SENet的残差块中,第6个块编码的特征向量输入到2个基于SENet的残差块中,第8个块编码的特征向量输入到1个基于SENet的残差块中;Step2.2:在各阶段的最后一个残差块之后添加通道注意力层,并添加一个从编码器到该层的残差连接;Step2.3:将个阶段的特征逐步通过二倍上采样和卷积层,得到五阶段具有相同通道数为30和相同分辨率为输入分辨率一半的特征;Step2.4:将第1、2、5阶段的特征逐像素相加融合,第2、3、5阶段的特征逐像素相加融合,第1、3、4阶段的特征逐像素相加融合,第1、4、5阶段的特征逐像素相加融合,然后经过卷积层得到四个预测,按照神经网络的由浅到深标记为预测1到预测4;所述Step3具体为:Step3.1:从真实深度图中获取最大深度d_max和最小深度d_min;Step3.2:将深度区间[d_min,d_max]平均地划分为10个小区间,一个小区间长度的计算公式如下: 在这10个区间中,第i个区间的深度值范围计算公式如下:[d_min+i-1×len,d_min+i×len]Step3.3:针对真实深度图作直方图,以找到在10个区间内占占场景深度比例最大的区间;Step3.4:根据所占比例将10个深度区间进行降序排列,计算Step2.4中预测1在第5个到第10个区间的均方误差,预测2在第4个到第8个区间的均方误差,预测3在第2个到第4个区间的均方误差,预测4在第1个和第2个区间的均方误差;Step3.5:将四部分误差组合,作为模型训练时约束预测1到预测4关注于局部到全局的一项损失项,计算公式如下: 其中λ1=0.5,λ2=λ3=0.6,λ4=1,ni是真实深度图经过区间掩码后像素总数,和分别是真实深度图和预测i中像素点pi的深度值。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人云南师范大学,其通讯地址为:650504 云南省昆明市呈贡区聚贤街768号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。