浙江大学;浙江钱塘机器人及智能装备研究有限公司赵阳获国家专利权
买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
龙图腾网获悉浙江大学;浙江钱塘机器人及智能装备研究有限公司申请的专利一种基于注意力机制的多尺度融合机器人抓取检测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN115909197B 。
龙图腾网通过国家知识产权局官网在2025-07-11发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202211385821.2,技术领域涉及:G06V20/52;该发明授权一种基于注意力机制的多尺度融合机器人抓取检测方法是由赵阳;王进;张海运;陆国栋设计研发完成,并于2022-11-07向国家知识产权局提交的专利申请。
本一种基于注意力机制的多尺度融合机器人抓取检测方法在说明书摘要公布了:本发明公开了一种基于注意力机制的多尺度融合机器人抓取检测方法,通过构建抓取检测模型并对其进行训练实现;该方法突出了抓取检测的显著特征,降低了对物体抓取检测没有贡献的背景信息的影响,提高了抓取检测模型的效率。同时采用轻量化的网络设计方法,可兼顾机器人抓取实时性和准确性的要求,完成端到端的抓取检测。另外,这种在杂乱场景中专注于目标本体特征的抓取检测方式,更契合人类的感知模式,进一步推动了机器人抓取检测的智能化过程。本发明解决了经验抓取检测方法为实现泛化性而很难满足精准性的问题;解决了抓取检测方法在真实场景中难以保证实时性的问题。
本发明授权一种基于注意力机制的多尺度融合机器人抓取检测方法在权利要求书中公布了:1.一种基于注意力机制的多尺度融合机器人抓取检测方法,其特征在于,包括: 构建抓取检测模型; 收集抓取数据集,其中包括RGB图像及相应的标注信息,及深度信息;对数据集进行尺度变换、平移、翻转和旋转的数据增强,扩充数据集,并对图像中所包含物体区域进行标定; 对数据集进行数据预处理,包括图像数据预处理及标注参数预处理,将扩充后的数据集按比例随机划分训练集和验证集; 利用训练集数据对提出的抓取检测模型进行训练,采用反向传播算法和基于标准梯度的优化算法来优化目标函数的梯度,使得检测得到的抓取框与真实值差异最小化;同时利用验证集对抓取检测模型进行测试,来调整抓取检测模型训练过程中的学习率; 根据训练得到的抓取检测模型,利用预处理之后的真实图像数据作为网络输入,抓取配置及抓取框五维表示作为抓取检测模型输出,最终映射到真实世界坐标; 所述抓取检测模型包括前端的特征提取器和后端的抓取预测器;其中特征提取器包括超大卷积模块、残差及多尺度模块、注意力模块依次连接; 所述抓取检测模型包括: 通道特征提取层,采用超大卷积核和深度可分离的构建方法,用于分别提取RGBD的特征,并对RGBD四通道的特征进行融合;再经过两次稀疏卷积降采样,进一步提取特征; RBF多尺度感受层,由若干层残差模块和RBF模块构成,使用残差模块避免梯度消失问题,RBF模块利用多分支卷积层扩张和合并以及不同的大小的空洞卷积模拟人类感受野; 注意力编码层,采用空间注意力和正则化注意力的组合方式,之后经过上采样,将特征图的尺寸还原为输入尺寸大小; 抓取生成层,利用经过上采样的特征图,通过多分支的输出模式获得回归结果; 标注参数处理包括:对抓取数据集的标签包括一系列的抓取位姿,每一个位姿分别转换成矩形框的形式来描述,即五维抓取表示{x,y,θ,w,h},其中x,y表示平行夹板中心点的像素坐标;w表示平行夹板的张开的尺寸;θ表示平行夹板张开方向与水平方向的夹角;h表示平行夹板的宽度,将标签转换为{G,Θ,W}的形式,其中G代表可抓取的区域,选取每个矩形的在沿长度方向中心13的部分作为可抓取位置的编码,可抓取位置编码为1,不可抓取位置编码为0;Θ表示可抓取位置的角度,使用sin2θ和cos2θ来表示角度,将可抓取位置分别编码为sin2θ和cos2θ;W代表抓取的宽度,将可抓取部分编码为该位姿的宽度值h,并进行归一化处理;所有的标签位姿组合形成最后的标签图,标签图为{P,sin2θ,cos2θ,W},其中P代表抓取位置。
如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人浙江大学;浙江钱塘机器人及智能装备研究有限公司,其通讯地址为:310058 浙江省杭州市西湖区余杭塘路866号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。