首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种预测控制方法 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:哈尔滨工业大学(深圳)

摘要:本发明公开了一种预测控制方法,用于配备有机械臂的水下机器人系统中,使移动平台上的机械臂保持理想的末端执行器状态;预测控制方法包括以下步骤:S10、对水下机器人系统中的移动平台和机械臂进行建模;S20、对所构建的模型采用模型预测控制MPC,考虑运动学可行性,采用二次规划QP进行快速求解,对外界扰动进行补偿并得到移动平台和机械臂的未来修正姿态;S30、对移动平台和末端执行器采用基于强化学习算法RL的控制器;S40、在水下机器人系统受到大扰动、动力学模型不匹配时,控制策略迁移使移动平台上的机械臂保持理想的末端执行器状态。本发明能够给出较为准确的系统模型,以形成有效控制。

主权项:1.一种预测控制方法,用于配备有机械臂的水下机器人系统中,使移动平台上的机械臂保持理想的末端执行器状态,其特征在于,所述预测控制方法包括以下步骤:步骤S10、对水下机器人系统中的移动平台和机械臂进行建模;步骤S20、对所构建的模型采用模型预测控制MPC,考虑运动学可行性,采用二次规划QP进行快速求解,对外界扰动进行补偿并得到移动平台和机械臂的未来修正姿态;步骤S30、对移动平台和末端执行器采用基于强化学习算法RL的控制器;控制器依据初始控制策略选择并执行动作,依据预先定义的奖励函数和获取到的实时的环境信号,更新控制策略,并判断是否为最优策略;若为最优控制策略,则结束当前学习并执行相应动作,否则重新进行此学习过程,直到达到最优控制策略为止;奖励函数为: 其中,d∈R3为主体与目标点在x、y、z轴方向的距离;v∈R4为主体当前的速度,包括在x、y、z轴方向的线速度与绕z轴的角速度;a∈R4为主体当前的控制策略,α为对应的系数;步骤S40、在水下机器人系统受到大扰动、动力学模型不匹配时,控制策略迁移使移动平台上的机械臂保持理想的末端执行器状态;其中,步骤S20包括如下:步骤S21、对移动平台运动预测,将移动平台的运动建模为具有仿射扰动的线性时不变系统:x3t+1=Ax3t+But,其中,x3移动平台的状态向量,u为移动平台受到的干扰,将控制动作从速度传播到位移给出顺序扰动之间的区别;将扰动观测与状态预测统一为对状态的估计,利用历史状态数据,采用自回归模型AR进行估计、预测未来的状态;步骤S22、将惯性系中对目标点的跟踪分解为惯性系下移动平台的运动与移动平台坐标系下机械臂的运动,以消除移动平台运动对末端执行器的干扰;步骤S23、对末端执行器运动预测控制,末端执行器的期望位置由任意时刻末端执行器的位置与控制输入得到: 其中,x4t+i∈R3为末端执行器的期望位置,x4t为已知的任意时刻末端执行器的位置,v∈R3为每个时间步长的离散的控制输入,Δt-1为控制频率;其中,步骤S40中策略迁移的方法为:系统在源域Dx上的轨迹为系统在目标域上的轨迹为其中x∈Rm1为源域Dx上的状态,为目标域上的状态,a∈Rn1为源域Dx上的动作,u∈Rn2为目标域上的动作,t为时间步长,m1和m2为状态的维度,n1和n2为动作的维度;状态、动作的源域与目标域有如下映射:m1=m2,n1=n2,Hx,a=u,定义为源域与目标域之间的状态映射函数,和为源域与目标域之间的互逆的动作映射函数,由神经网络拟合得到的系统在源域上的正动力学模型Fxt,at=xt+1,分别采集源域与目标域上的状态与动作数据使用监督学习的方法训练模型,定义目标函数为: 其中,||·||1为1范数;状态映射函数G与动作映射函数P将某一时刻目标域中的状态与动作ut映射到源域中,得到源域中的状态与动作作为源域上的正动力学模型F的输入;状态映射函数G将目标域状态映射到源域中,得到源域中下一个时间步长的状态值固定模型F,通过对P的训练,使得F的输出约等于F、P、H三个模型均采用全连接神经网络进行训练,首先对模型F训练,再固定模型F训练模型P,然后固定模型P,训练模型H。

全文数据:

权利要求:

百度查询: 哈尔滨工业大学(深圳) 一种预测控制方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。