首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于改进强化学习奖励函数的四足机器人运动控制方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:常州大学

摘要:本发明涉及四足机器人技术领域,尤其涉及基于改进强化学习奖励函数的四足机器人运动控制方法及系统,包括构建四足机器人仿真模型;构建马尔可夫决策过程,定义马尔可夫决策的状态空间、行动空间、过渡概率和奖励函数,利用线速度奖励函数、角速度奖励函数、基础运动奖励函数、足部离地奖励函数、身体碰撞奖励函数、目标平滑度奖励函数和扭矩奖励函数并赋予不同的权重系数,得到总奖励函数;利用教师‑学生模型中教师策略对总奖励函数进行训练,并将训练得到的奖励值输入学生策略中。本发明提供利用教师‑学生框架对奖励函数进行训练,解决四足机器人在挑战性环境中的稳定性问题。

主权项:1.基于改进强化学习奖励函数的四足机器人运动控制方法,其特征在于,包括以下步骤:步骤一、构建四足机器人仿真模型;步骤二、构建马尔可夫决策过程,定义马尔可夫决策的状态空间、行动空间、过渡概率和奖励函数,利用线速度奖励函数、角速度奖励函数、基础运动奖励函数、足部离地奖励函数、身体碰撞奖励函数、目标平滑度奖励函数和扭矩奖励函数并赋予不同的权重系数,得到总奖励函数;步骤三、利用教师-学生模型中教师策略对总奖励函数进行训练,并将训练得到的奖励值输入学生策略中。

全文数据:

权利要求:

百度查询: 常州大学 基于改进强化学习奖励函数的四足机器人运动控制方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。