首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种多自由度机械臂容错控制方法_西南科技大学;西南科大四川天府新区创新研究院_202211656127.X 

申请/专利权人:西南科技大学;西南科大四川天府新区创新研究院

申请日:2022-12-22

公开(公告)日:2024-06-21

公开(公告)号:CN116021516B

主分类号:B25J9/16

分类号:B25J9/16

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2023.05.16#实质审查的生效;2023.04.28#公开

摘要:本发明公开了提供了一种多自由度机械臂容错控制方法,针对核辐射环境中机械臂关节随机故障且无法获取准确故障信息这一特点,本发明采用额外的传感器获取目标点相对于末端执行器坐标系的位置,将故障机械臂的运动控制问题转化为目标点到达问题,通过DRL算法训练形成机械臂容错控制策略,利用该策略,在某一确定关节发生故障的机械臂系统和任一关节发生故障的机械臂系统的控制任务均能够实现良好的控制效果。

主权项:1.一种多自由度机械臂容错控制方法,其特征在于,包括以下步骤:S1、搭建机械臂容错实验平台;S2、在机械臂容错实验平台中建立针对主从遥操作机械臂的任务环境;S3、在任务环境中,确定机械臂在完成任务时的关节角度,并组成状态空间;S4、构建DDPG容错控制模型,并利用状态空间进行模型训练;S5、利用训练好的DDPG容错控制模型对多自由机械臂在任务环境中进行容错控制;所述步骤S1中,在机械臂容错实验平台中,将OXYZ坐标系设为机械臂所在的三维空间坐标系,其中O表示机械臂运动区域中心,X轴指向正北方向,Z轴指向正东方向,Y轴指向垂直向上的方向;所述步骤S2中,建立任务环境的方法为:将机械臂的目标任务实现问题转换为机械臂末端执行器到目标任务位置的到达问题,确定各目标任务位置,其中为目标任务位置点基于机械臂末端执行器坐标系的X轴坐标值,为目标任务位置基于机械臂末端执行器坐标系的Y轴坐标值;所述步骤S3中,组成的状态空间为: 式中,为基底坐标系下机械臂末端到目标任务位置所在点之间欧氏距离的控制变量,当该距离小于设定距离L时,,当该距离大于设定距离L时,;根据安装在机械臂末端执行器的深度相机位置确定;为机械臂在完成任务时的关节角度,i为机械臂的关节序号,当第i个关节故障时,ji为0,i=1,2,3;所述步骤S4具体为:S41、构建DDPG容错控制模型,并设置奖励函数;S42、将状态空间S输入至DDPG容错控制模型并输出动作A,并根据动作执行情况确定经验样本,并存储至DDPG容错故障模型的经验回放池;其中,为当前状态空间,为下一时刻的状态空间,为当前动作的奖励值;S43、从经验回放池中随机抽取N个数据组对DDPG容错控制模型进行机械臂容错控制策略训练,直到DDPG容错控制模型收敛;所述步骤S41中,所述机械臂的每个关节均对应一个DDPG容错控制模型,其表示为: 式中,为机械臂末端当前执行器与目标任务位置所在点的距离,为目标任务位置所在点到机械臂末端执行器坐标系的欧氏距离,为目标任务所在点的坐标;所述DDPG容错控制模型包括Critic网络和Actor网络,为当前环境的状态信息,为当前环境下的机械臂关节的执行动作,和分别为Critic网络和Actor网络的网络参数;所述步骤S41中,根据目标任务位置所在点与机械臂末端坐标间的欧氏距离设置奖励函数;所述奖励函数给定奖励值的方法为:当机械臂末端执行器向远离目标任务位置所在点的方向运动时,奖励函数的奖励值r减少1,当靠近目标任务位置所在点的方向移动时,奖励函数的奖励值r增加1;且当机械臂末端执行器与远离目标任务位置所在点的距离小于2L时,奖励函数的奖励值r每步增加0.5,并在机械臂完成目标任务的消耗步数小于预设的最大步数时,奖励值赋为10;所述步骤S42中,输出动作A表示为: 式中,和表示剩余两个健康关节在单步中的增量,下标1和2表示健康关节靠近机械臂基座的优先级顺序,即下标为1的健康关节比下标为2的健康关节更靠近机械臂基座;所述步骤S43中,对DDPG容错控制模型进行训练时,通过参数为的表示机械臂容错控制的近似策略,并根据其累计回报期望对参数求梯度来进行机械臂容错控制策略的更新,其表达式为: 式中,为策略参数在中的梯度,为所获得的回报的期望值,为智能体在采样策略π下所能获取的汇报的期望值,为当前策略所选取的动作a的梯度,为当前策略所更新的梯度,为智能体当前策略通过当前策略选取出智能体执行的动作,为在状态s执行动作a后的期望回报值,由参数为的Critic网络估计获得,Actor网络根据该Q值确定执行策略在状态s采取动作a的优劣。

全文数据:

权利要求:

百度查询: 西南科技大学;西南科大四川天府新区创新研究院 一种多自由度机械臂容错控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术