首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明公布】受并行推理机制启发的机器人运动规划和避障决策方法_北京师范大学_202311811950.8 

申请/专利权人:北京师范大学

申请日:2023-12-26

公开(公告)日:2024-06-25

公开(公告)号:CN118238129A

主分类号:B25J9/16

分类号:B25J9/16

优先权:

专利状态码:在审-公开

法律状态:2024.06.25#公开

摘要:本发明涉及机器人控制技术领域,特别是指一种受并行推理机制启发的机器人运动规划和避障决策方法,方法包括:对人脑并行推理脑机制进行分解以及分别建模;设计并行仲裁模块,并将其嵌入到规划方法中,同时评估利用和探索的二元操作;构建推断缓冲区,基于所设计的可靠性推断函数协调其中的行为策略;多行为策略引导机器人运动规划产生示例样本,动态调整行为策略以适应复杂环境;在收集示例样本的过程中,机器人利用深度强化学习基于先前的成功经验进行自更新学习,引导机器人探索更具潜力的环境。采用本发明,使机器人在复杂环境中准确地到达目标位置,在没有大规模数据以及大算力的条件下,针对复杂地形进行高效规划和精准避障。

主权项:1.一种基于并行推理机制的机器人运动规划和避障决策方法,其特征在于,所述方法由基于并行推理机制的机器人运动规划和避障决策系统实现,所述基于并行推理机制的机器人运动规划和避障决策系统包括机器人控制端以及机器人;所述方法包括:S1、所述机器人控制端获取机器人的当前位置以及目标位置,根据所述机器人的当前位置以及目标位置;S2、所述机器人确定推理缓冲区以及策略集,所述推理缓冲区以及所述策略集均包括多个非学习的规划方法以及一个基于学习的规划方法bu;S3、所述机器人控制端计算所述推理缓冲区中每个规划方法的事前可靠性;S4、所述机器人控制端根据每个规划方法的事前可靠性,选择局部最优行为策略,将所述局部最优行为策略发送给所述机器人;S5、所述机器人接收到所述局部最优行为策略后,在所述局部最优行为策略的指导下,得到目标路径,并执行目标路径,将所述目标路径作为训练样本填充进训练缓冲区中,当训练缓冲区到达一定数量,所述机器人对bu进行一次更新学习;S6、所述机器人若接收到bu作为局部最优行为策略,根据候选状态进行建模,得到相关性状态模型;所述机器人在所述相关性状态模型的基础上设计一个神经约束观察函数;S7、根据神经约束观察函数计算候选状态的观测值,并确定出最大观测值;S8、如果所述最大观测值大于预设阈值,则将所述最大观测值对应的候选状态扩展为下一个状态;如果所有观测值均小于或等于预设阈值,则所述机器人采样新的临时探测状态,重复执行S7-S8,直至确定下一个状态;S9、所述机器人在策略bu的指导下,不断扩展新的状态,直至到达终点,得到目标路径,并执行目标路径。

全文数据:

权利要求:

百度查询: 北京师范大学 受并行推理机制启发的机器人运动规划和避障决策方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。