基于神经网络和强化学习的机器人步态规划算法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：合肥工业大学

摘要：本发明涉及机器人步态规划领域，尤其涉及基于神经网络和强化学习的机器人步态规划算法，包括以下步骤：建立动作网络与评价网络，根据机器人的当前状态与机器人控制器的参数建立强化学习的目标函数模型，获取当前策略下执行动作后，环境状态变化过程中的即时奖励值，通过动作网络与评价网络对奖励值进行更新以获取最优步态参数，并将该参数输入至机器人控制器中。本发明通过奖励机制与神经网络之间的结合来形成对机器人行动策略所产生的变化进行不断地学习，直至获得最优的步态参数，并将通过机器学习所产生的步态参数与控制器进行结合来实现对机器人步态的准确规划，以实现对机器人步态的精确跟踪。

主权项：1.基于神经网络和强化学习的机器人步态规划算法，其特征在于，包括以下步骤：S1：建立动作网络与评价网络，根据机器人的当前状态与机器人控制器的参数建立强化学习的目标函数模型；S2：获取当前策略下执行动作后，环境状态变化过程中的即时奖励值；S3：通过动作网络与评价网络对奖励值进行更新以获取最优步态参数，并将该参数输入至机器人控制器中；S201：根据机器人系统参数的不确定性，建立机器人下肢的动力学模型根；S202：在U-K方程的基础上，根据拉格朗日定理，建立无不确定性的一般约束系统的运动模型；S203：在不考虑摩擦力的情况下，根据机器人系统中的伺服约束建立受约束的机器人系统的显式运动模型；S204：在没有不确定性时的约束力的情况下，根据达朗贝尔原理的高斯原理和拉格朗日形式建立约束力模型；S205：根据约束力模型来设计鲁棒控制器；所述步骤S201中的机器人下肢的动力学模型如下：其中，t表示时间，p表示关节的角位移，且p∈Rn，为机器人系统的角速度，为机器人系统的角加速，ε是不确定性的有界量，τt表示关节的输入力矩，H·∈Rn代表惯性矩阵，C·表示科氏力和离心力矩阵，F·是摩擦力和外部扰动矩阵，G·是重力项矩阵；所述步骤S202中的无不确定性的一般约束系统的运动模型如下：其中，p＝[p1,p2,…,pn]T，表示广义坐标，Hp,t∈Rn，表示系统对称的正定惯性矩阵，表示用于将系统摆脱约束的广义主动力矩阵；所述步骤S203中受约束系统的显式运动模型为：其中，是约束力的矩阵，并驱动系统满足给定的约束，表示用于将系统摆脱约束的广义主动力矩阵；所述步骤S204中的约束力模型如下：其中，是约束力的矩阵，t表示时间，“+”为广义逆矩阵，A为约束方程，p表示关节的角位移，且p∈Rn，为机器人系统的角速度，H·∈Rn代表惯性矩阵，C·表示科氏力和离心力矩阵，F·是摩擦力和外部扰动矩阵，G·是重力项矩阵；所述步骤S205中设计获得的鲁棒控制器如下：其中，A为约束方程，H·∈Rn代表惯性矩阵，t表示时间，p表示关节的角位移，为机器人系统的角速度，是约束力的矩阵，P是所提的控制器的给定的参数矩阵，且P0，k是增益系数，ε是不确定性的有界半径的大小。

全文数据：

权利要求：

百度查询：合肥工业大学基于神经网络和强化学习的机器人步态规划算法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种潮气量检测系统及装置

下一篇：一种面向单层隔振系统的惯容器设计方法

相关技术

一种潮气量检测系统及装置

一种面向单层隔振系统的惯容器设计方法

一种磁芯的包胶带单元

一种像控点坐标生成方法、系统、设备及存储介质

金属燃料电池与其他类型蓄电池的协同应用系统及方法

集中供暖设备

用于涡轮发动机的密封支撑组件

折边装置、折边系统及折边方法

半导体器件及其制备方法

线条体固定部件、线条体增设用固定部件以及线条体安装方法

接地开关

一种正负可调叠加高频脉冲的电源

学习相关技术

设备诊断系统、学习装置、已学习模型和已学习模型的生成方法_三菱电机株式会社_202380020059.4

已学习模型验证系统_三菱电机株式会社_202280091859.0

学习装置、处理装置、学习方法、姿势检测模型、程序及存储介质_株式会社东芝_202280091814.3

一种基于路由选择与原型学习的主动增量学习方法_西北工业大学_202410845596.9

机器学习智能派工系统及由机器学习进行智能派工的方法_联芯集成电路制造(厦门)有限公司_202310289849.4

学习可压缩的特征_谷歌有限责任公司_201980004446.2

主动学习以改善晶片缺陷分类_ASML荷兰有限公司_202380021046.9

学习模型产生装置、学习模型产生方法及存储着学习模型产生程序的计算机可读媒介_株式会社斯库林集团_202410333646.5

基于自步学习与个性化联邦学习的多中心数据处理方法_中国科学院自动化研究所_202411166576.5

基于深度学习的肿瘤组织溯源方法及设备_苏州可帮基因科技有限公司_202411196097.8

机器人相关技术

手术机器人、机器人从动系统以及机器人控制系统_武汉联影智融医疗科技有限公司_202323570336.5

手术机器人、机器人从动系统以及机器人控制系统_武汉联影智融医疗科技有限公司_202323591830.X

机器人控制装置以及机器人系统_发那科株式会社_202280091864.1

机器人以及机器人系统_精工爱普生株式会社_202410329160.4

机器人_美的集团(上海)有限公司_202310287918.8

搬运机器人_烟台大学_202420195304.7

机器人_广东拓斯达科技股份有限公司_202410777391.1

机器人_腾讯科技(深圳)有限公司_202111348884.6

楼梯清洁机器人_烟台大学_202420215927.6

小型龙舞机器人_王显平_202323400945.6

步态相关技术

基于步态信号的节律性听觉刺激训练系统_浙江大学_202410892085.2

基于神经网络和强化学习的机器人步态规划算法_合肥工业大学_202311392721.7

一种单自由度步态康复机构_华西精创医疗科技(成都)有限公司_202322255941.7

基于摔倒判断的人形机器人步态控制方法和装置_中国科学院自动化研究所_202410644753.X

异常步态行为检测系统、方法、电子设备及可读存储介质_合肥综合性国家科学中心人工智能研究院(安徽省人工智能实验室)_202211370089.1

一种基于特征融合的跨视角步态识别方法及系统_武汉大学_202111076716.6

一种融合注意力机制和短期时序特征提取的步态识别方法_长春理工大学_202410818076.9

一种适用于角钢塔攀爬机器人的避障步态规划方法_国网安徽省电力有限公司_202210862477.5

基于步态识别的情感辅助分析方法及系统_山东新众通信息科技有限公司_202410948120.8

一种脑卒中步态康复训练器_中国人民解放军联勤保障部队第九六〇医院_202322825211.6

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于神经网络和强化学习的机器人步态规划算法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务