首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于Masked Point-Transformer的双模态融合6D位姿估计方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:山东科技职业学院

摘要:本发明专利公开了一种基于MaskedPoint‑Transformer的双模态融合6D位姿估计方法,提供一种新的端到端的网络,该网络通过向量注意力机制建立空间感知,实现深度值信息的鲁棒提取;引入交叉注意力机制整合像素级别图像的空间和颜色特征,促进MPT模块和双模态融合模块两种模态之间的互补关联,通过捕获空间点的长距离特征并引入交叉跨模态的融合策略来提取与聚合模态间的突出特性,从而提高弱纹理光滑物体以及对象之间遮挡的6D位姿精度,本发明通过使用双模态融合的姿态估计方法,提供更丰富的语义信息和上下文信息,有效提高6D对象姿态估计的鲁棒性。

主权项:1.一种基于MaskedPoint-Transformer的双模态融合6D位姿估计方法,其特征在于,包括以下步骤:步骤101、图像分割预处理:接收RGB图像并进行预处理,训练SegNet网络用于分割图像中特定的对象,从而生成相应的掩膜,利用卷积神经网络预测每个对象的掩膜,消除不相关区域的影响;步骤102、特征提取:将裁剪后的RGB图送入全卷积网络,从RGB图像中提取外观特征,同时对深度图像进行掩膜提取并转换为点云,裁剪后的深度图将根据转换成点云并输入MPT模块进行空间像素级特征提取,多个级联MPT块组合和ResNet18共同构成的双模态特征提取结构;步骤103、特征融合:采用双模态注意力机制交叉融合外观和几何特征,提取的特征输入融合模块以融合颜色特征和空间特征;步骤104、位姿估计:预测所有采样像素旋转、平移和置信度,基于特征回归每个节点的6D姿态,预测置信度得分,选择具有最高置信度的估计姿势作为最终预测结果。

全文数据:

权利要求:

百度查询: 山东科技职业学院 一种基于Masked Point-Transformer的双模态融合6D位姿估计方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。