首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】一种基于多目标MAP-Elites的机器人损伤恢复方法_华南理工大学_202410612668.5 

申请/专利权人:华南理工大学

申请日:2024-05-17

公开(公告)日:2024-06-14

公开(公告)号:CN118192276A

主分类号:G05B13/04

分类号:G05B13/04

优先权:

专利状态码:在审-公开

法律状态:2024.06.14#公开

摘要:本发明公开了一种基于多目标MAP‑Elites的机器人损伤恢复方法,涉及机器人控制技术领域,包括初始化行为地图,从行为地图中挑选一个父代控制器参数;利用多个样本控制器参数计算得到得到梯度方向信息,将父代控制器参数进化为子代控制器参数;根据支配关系,更新行为地图网格中的参数;采用基于地图的贝叶斯优化算法和行为地图,初始化损伤恢复模型;对损伤恢复模型进行调整和搜索,得到最佳控制器参数。相比于现有技术,无需与真实环境交互,即可获得使机器人在受损环境得到损伤恢复的控制器参数,且大大节省了搜索时间,有效的提高了运算效率。

主权项:1.一种基于多目标MAP-Elites的机器人损伤恢复方法,所述机器人为多足机器人;其特征在于,包括行为地图构建阶段和损伤适应阶段,分别对应机器人的未受损环境和受损环境;所述未受损环境和所述受损环境均为模拟环境;所述受损环境至少有一个;所述行为地图构建阶段,包括如下步骤:T1、初始化行为地图;所述行为地图包括若干个网格,网格内存储有至少一个控制器参数;T2、从所述行为地图中挑选一个所述控制器参数,作为父代控制器参数;在所述父代控制器参数的周围采样,得到多个样本控制器参数;将多个所述样本控制器参数分别与所述未受损环境进行交互,并评估所述交互,得到评估结果,所述评估结果包括行为特征、距离适应度值和成本适应度值;根据所述评估结果计算进化梯度,得到梯度方向信息;其中,所述交互即使用所述控制器参数控制所述机器人在所述模拟环境中运行一个回合步数;T3、根据所述梯度方向信息,进化所述父代控制器参数,得到子代控制器参数;将所述子代控制器参数与所述未受损环境进行交互并得到评估结果,根据所述行为特征定位所述子代控制器参数对应于所述行为地图内的位置,得到目标网格;T4、根据所述距离适应度值和所述成本适应度值,比对所述子代控制器参数和所述目标网格内的所有控制器参数之间的支配关系;根据所述支配关系,将所述子代控制器参数存储至所述目标网格,或替换所述目标网格内的控制器参数,或将所述子代控制器参数丢弃;T5、重复执行步骤T2至T4,直至达到预设的第一迭代停止条件;所述损伤适应阶段包括如下步骤:T6、选择一个所述受损环境,采用基于地图的贝叶斯优化算法和所述行为地图,初始化损伤恢复模型;对所述损伤恢复模型进行调整和搜索,得到最佳控制器参数;通过使用所述最佳控制器参数,使所述多足机器人在所述受损环境得到恢复;T7、重复步骤T6,直至模拟全部所述受损环境。

全文数据:

权利要求:

百度查询: 华南理工大学 一种基于多目标MAP-Elites的机器人损伤恢复方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。

相关技术
相关技术
相关技术
相关技术