首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于深度强化学习的机械臂容错避障方法_西南科技大学;西南科大四川天府新区创新研究院_202211656119.5 

申请/专利权人:西南科技大学;西南科大四川天府新区创新研究院

申请日:2022-12-22

公开(公告)日:2024-06-21

公开(公告)号:CN116021515B

主分类号:B25J9/16

分类号:B25J9/16

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2023.05.16#实质审查的生效;2023.04.28#公开

摘要:本发明公开了一种基于深度强化学习的机械臂容错避障方法,包括:S1、搭建机械臂容错实验平台,并建立容错测试环境;S2、在容错测试环境中,生成机械臂的避障路径;S3、构建机械臂容错避障模型,并利用避障路径进行模型训练;S4、利用训练好的机械臂容错避障模型对故障机械臂在任务环境进行避障路径跟随控制,实现容错避障。本发明方法解决现有无法在未知故障情况下机械臂的容错控制,提高算法控制效率,增强机械臂作业的智能性,实现机械臂在出现未知故障时,自主判断任务的可行性,通过容错控制,仍能够继续完成当前任务。

主权项:1.一种基于深度强化学习的机械臂容错避障方法,其特征在于,包括以下步骤:S1、搭建机械臂容错实验平台,并建立容错测试环境;S2、在容错测试环境中,生成机械臂的避障路径;S3、构建机械臂容错避障模型,并利用避障路径进行模型训练;S4、利用训练好的机械臂容错避障模型对故障机械臂在任务环境进行避障路径跟随控制,实现容错避障;所述步骤S1中,在机械臂容错实验平台中,将OXYZ坐标系设为机械臂所在的三维空间坐标系,其中O表示机械臂运动区域中心,X轴指向正北方向,Z轴指向正东方向,Y轴指向垂直向上的方向;所述步骤S1中,建立容错测试环境的方法为:在机械臂所在的三维空间中,随机故障关节及其故障角度,并随机摆放障碍物及设定目标任务位置;所述步骤S2具体为:S21、在容错测试环境中,利用蒙特卡洛法随机生成机械臂目标任务的N个末端可达点作为工作空间点,并记录各工作空间点的角度信息,形成初始工作空间;S22、将初始工作空间栅格化为等距的网格;S23、对各网格中的工作空间点位置进行加密,进而生成工作空间FTW;S24、确定工作空间FTW中可达空间网格的可操作度;其中,在工作空间FTW的栅格化网格中,将工作空间点数为零的网格作为不可达空间网格,剩余网格作为可达空间网格,并将包含可操作度的可达空间网格作为机械臂的容错工作空间MFTW;S25、遍历各可达空间网格,将当前可达空间网格的可操作度代入网格代价函数中,计算当前可达空间网格的代价值;S26、确定当前可达空间网格下周围网格的代价值,将最小代价值对应的周围可达空间网格作为当前可达空间网格路径下的下一可达空间网格,进而生成机械臂的避障路径;所述步骤S23中,将工作空间点数小于设定精度阈值且不为零的网格内部工作空间点数进行加密;所述步骤S24中,可达空间网格的可操作性度的计算公式为: 式中,表示第m个可达空间网格中第i个点的可操作度,表示第m个可达空间网格当前角度下的雅克比矩阵,为工作空间FTW的栅格化网格数量;所述步骤S25中,网格代价函数的表达式为: 式中,为第m个可达空间网格的代价值,为从初始可达空间网格到当前可达空间网格的代价,为从当前可达空间网格到目标可达空间网格的代价,为网格的可操作度能力,分别为、和的系数;其中,,,为当前点的三维坐标,为初始点的三维坐标,为目标点的三维坐标;所述步骤S26具体为:S26-1、将根据当前可达空间网格路径下的下一可达空间网格确定的路径作为机械臂的初始避障路径;S26-2、通过贝塞尔曲线对生成的初始路径进行平滑处理,并将初始路径中的拐点进行多次平滑处理,进而生成机械臂的避障路径;所述步骤S3中的容错避障模型为基于深度强化学习的SAC算法模型,其状态空间为: 式中,为机械臂末端执行器的位置,为操作对象的位置,为避障路径中目标任务点的位置;所述SAC算法模型的奖励函数R包括密集奖励和稀疏奖励;其中,密集奖励为: 式中,w1为密集奖励权重,为机械臂执行器末端与目标任务位置之间的欧式距离,;稀疏奖励为: 式中,为判断机械臂末端与目标坐标距离产生的奖励,为可操作椭球大小,和分别为和的权重,,,J为末端姿态对应的雅克比矩阵。

全文数据:

权利要求:

百度查询: 西南科技大学;西南科大四川天府新区创新研究院 一种基于深度强化学习的机械臂容错避障方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术