基于注意力机制和非合理动作抑制的机械臂自主抓取方法

导航：龙图腾网> 最新专利技术> 基于注意力机制和非合理动作抑制的机械臂自主抓取方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：杭州电子科技大学

摘要：本发明涉及基于注意力机制和非合理动作抑制的机械臂自主抓取方法。采用深度强化学习方法通过奖励函数指导智能体进行物体的自主抓取技能的学习。利用注意力机制使得网络在试错中持续关注能够提升抓取成功率的抓取位置区域；设计的非合理动作抑制策略，能够有效解决强化学习方法从仿真迁移到真实环境中存在状态差异的问题。本发明具有很高的环境适应性和抓取成功率，能够在复杂环境下实现对物体的高效自主抓取。

主权项：1.基于注意力机制和非合理动作抑制的机械臂自主抓取方法，其特征在于，该方法的具体步骤是：步骤1：利用RGB-D相机采集目标区域的深度图Idepth和彩色图Icolor，尺寸为H×W，将彩色图Icolor和深度图Idepth以ΔΘ为旋转间隔逆时针旋转d次，得到d组具有不同旋转方向的彩色图和深度图记为状态st，其中t表示当前时刻；步骤2：构建深度强化学习网络，网络由特征提取层、注意力机制层、上采样层和非合理动作抑制层组成；a特征提取层：将d组彩色图和深度图输入网络，对每一组进行特征提取；以第di组为例，和各自通过一个经过ImageNet预训练的ResNet-50网络的卷积层部分进行特征提取操作得到颜色特征图和深度特征图b注意力机制层：将颜色和深度特征图进行通道拼接操作得到融合特征图然后将经过一个注意力机制模块，让网络持续关注杂乱物体中较好的抓取位置区域，得到注意力机制的操作步骤如下: 注意力机制模块中首先将特征图沿着空间维度进行全局平均池化操作得到将通过一个全连接层L1和RectifiedLinearUnit激活层，对每个通道的特征信息进行特征融合；接着再经过一个全连接层L2和Sigmod激活层得到注意力机制模块的权重的维度与输入特征图通道维度一致；将和进行乘法操作得到最终的输出其中AvgPool·表示空间全局平均池化操作，L1·和L2·表示全连接层，σ·表示RectifiedLinearUnit激活层，Sigmod·表示Sigmod激活层，bn·表示BatchNormalization操作；c上采样层:将注意力特征图经过一个卷积核大小为1×1的卷积层、BatchNormalization层和RectifiedLinearUnit激活层得到特征图实现通道降维；然后，将特征图进行顺时针旋转，使其回到与彩色图Icolor一样的角度方向，再进行上采样操作得到尺寸为H×W的上采样图d组颜色状态图和深度状态图获得d组上采样图进行通道拼接操作得到d维尺寸为H×W的像素级别的动作预测Qst,a；θ；其中，θ为网络参数，a表示抓取动作的动作空间，该动作空间由机械臂的执行位置xw,yw,zw和夹爪旋转角度Θ组成；d非合理动作抑制层：根据Qst,a；θ得到每个通道维度下的最大动作预测值，即最佳抓取位置xw,yw,zw和夹爪旋转角度Θ，共获得d维最佳动作预测；在每个维度中，沿着各自的最佳动作方向，经过不同的偏移后，得到不同掩码区域k表示不同的掩码区域，d表示维度；具体的，掩码区域是以该维度下的最佳抓取位置沿着抓取方向偏移不同像素后的像素点为中心，尺寸为hg,wg的长方形区域；掩码区域的长边wg与抓取方向垂直；表示在掩码区域内属于物体区域的概率，对同一个动作方向不同偏移值下的进行求均值操作得到该动作方向上最终的概率Pd；其中，K表示每个动作方向上的掩码区域数量；Pd越小表示成功抓取物体的概率越大，碰撞的概率越小；因此，非合理动作抑制策略πst为：πst＝1-Pd6将d维的非合理动作抑制策略πst与d维的最大动作预测值Qst,a；θ进行通道相乘操作，最终获得时刻t下的最佳动作at；步骤3：设计奖励函数，训练强化学习网络；①奖励函数设计：抓取奖励rg定义如下：rg＝G-λΔΨ7ΔΨ＝|ΕΘ-ΟΘ|∈[0°,90°]8其中，G表示抓取的结果，如果抓取成功G＝1.5，如果抓取失败G＝0；ΔΨ表示抓取角度的偏差，由夹爪实际旋转角度ΕΘ与该物体实际角度ΟΘ的绝对差计算得到，λ表示该角度偏差对于抓取奖励的影响程度；②采用时间差分的双重Q学习更新方式对网络进行训练；在时间t，采集机械臂工作区间的RGB-D图像得到状态st，将st输入当前网络得到最佳执行动作atxw,yw,zw,Θ；执行该动作at后，再次采集RGB-D图像得到下一个状态st+1，根据物体是否抓取成功，给动作at的一个奖励rg；采用时间差分法来最小化当前状态下执行动作的动作预测值Qst,at；θ与带有未来期望奖励的目标值之间的时间差分误差；该目标值yt采用双重Q学习方法定义：其中，参数θtarget表示动作价值目标网络，该参数来自于Δt时刻前的网络参数；γ表示衰减因子；步骤4：完成步骤3的训练后，将训练好的网络参数直接从仿真环境迁移到真实环境中，通过相机对机械臂工作区间环境进行图像采集，进而得到状态st；将状态st输入网络得到最佳执行动作atxw,yw,zw,Θ，通过ROSMoveIt运动规划库对机械臂抓取的路径进行规划与控制。

全文数据：

权利要求：

百度查询：杭州电子科技大学基于注意力机制和非合理动作抑制的机械臂自主抓取方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种椰子果肉洗涤装置

下一篇：一种覆膜印刷品的防粘连装置

相关技术

一种椰子果肉洗涤装置

一种覆膜印刷品的防粘连装置

用于质检排班的数据库管理方法、计算机设备及计算机可读存储介质

一种改性塑料生产用循环冷却装置

机载配电系统及飞行器

一种控制面板的装配结构

一种多工位双面印刷装置

一种合金钢带修磨装置

一种负压风机末端多级除臭系统

低散射辐射单元及多频共口径天线阵列

地铁站台无障碍上下车装置

一种用于腻子粉生产的干燥装置

机械相关技术

机械臂_瑞德医疗机器股份有限公司_202280090964.2

机械停车设备防晃装置及机械停车设备_李翔宇_201811079617.1

一种机械加工用固定机械夹具_烟台汽车工程职业学院_202420230019.4

机械式钟表_精工爱普生株式会社_202410341827.2

精密机械加工夹具_永济市磊鑫机械配件制造有限公司_202420041060.7

组合光源和机械臂_凌云天博光电科技股份有限公司_202323659668.0

机械臂进样模块_南京岚煜生物科技有限公司_202411078475.2

一种机械臂内激光自由传输的机械臂_华中科技大学_202211054451.4

机械臂的弹性限制控制方法及装置、介质、终端、机械臂_东北大学_202411194451.3

用于检测工程机械行驶稳定性的方法、装置及工程机械_中科云谷科技有限公司_202411062425.5

动作相关技术

一种下肢动作规范辅助训练架_山东师范大学_202323102795.0

一种基于姿态评估的运动员动作识别方法_河北省体育科学研究所(河北省体育局反兴奋剂服务中心)_202410936478.9

基于动作识别和人机距离的人机共融风险预警方法及系统_山东大学_202210453368.8

确定执行设备的动作选择方针的方法和装置_创新先进技术有限公司_201980040188.3

用于快速断路器永磁保持机构动作的测试装置及测试方法_安徽徽电科技股份有限公司_202411194446.2

一种数字人动作生成方法及生成系统_山东云小华数字科技有限公司_202411165447.4

用于评判哺乳动物动力学的动作捕获和分析系统_凯耐特赛斯公司_202410650407.2

动作分类方法、装置、电子设备和可读存储介质_三一智能装备有限公司_202410907981.1

一种基于连续动作强化学习的激光相干合成控制算法_广东工业大学_202410843723.1

水电机组调速器接力器不动作时间仿真测试系统及方法_贵州电网有限责任公司_201910887201.0

抑制相关技术

用于抑制皮层扩散性抑制发作的闭环超声刺激方法及系统_燕山大学_202410845926.4

智能话筒噪音抑制方法及系统_深圳市好兄弟电子有限公司_202411185370.7

一种甩头抑制试验仪_上海志听医疗科技有限公司_201911030716.5

CDK9抑制剂_原真股份有限公司_202380017856.7

补体因子抑制剂及其用途_安尼艾克松股份有限公司_202380022104.X

抑制器扼流圈磁芯、包括这种抑制器扼流圈磁芯的抑制器扼流圈以及用于形成抑制器扼流圈磁芯的方法_胜美达集团有限公司_202380018134.3

Rage受体抑制剂在制备抑制淋巴细胞减少或死亡的药物中的应用_中南大学湘雅三医院_202410696728.6

一种提高活性肽ACE抑制率的修饰方法、ACE抑制肽及其应用_吉林农业大学_202210192808.9

用于抑制细胞中MASP-2表达的核酸_赛伦斯治疗有限责任公司_202380021246.4

基于强反光抑制的缺陷检测方法和系统_山东博昂信息科技有限公司_202411008166.8

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于注意力机制和非合理动作抑制的机械臂自主抓取方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务