买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:中国人民解放军国防科技大学
摘要:本发明公开了基于强化学习模型的机器人群体协调方法,包括以下步骤:每个机器人被隐马尔科夫模型分配角色;机器人i将历史观测和动作编码成机器人i轨迹τi,来自机器人i和轨迹τi的观测值被送入强化学习网络;所述强化学习网络为角色分配效用矩阵,对效用矩阵进行张量环分解后,动态调整秩的大小,以优化单个机器人的局部效用;单个机器人的局部效用优化之后,所述强化学习网络对机器人i轨迹τi局部观测通过误差正则项和惩罚正则项进行优化;每个机器人根据优化后的局部观测做出独立决策。本申请动态调整张量秩的大小,使得单个无人机的局部效用得到优化;对无人机通过全局信息对局部观测优化,从而对无人机进行统一协调。
主权项:1.一种基于强化学习模型的机器人群体协调方法,其特征在于,包括以下步骤:每个机器人被隐马尔科夫模型分配角色;机器人i将历史观测和动作编码成机器人i轨迹τi,来自机器人i和轨迹τi的观测值被送入强化学习网络;所述强化学习网络为角色分配效用矩阵,对效用矩阵进行张量环分解后,动态调整秩的大小,以优化单个机器人的局部效用;单个机器人的局部效用优化之后,所述强化学习网络对机器人i轨迹τi局部观测通过误差正则项和惩罚正则项进行优化;每个机器人根据优化后的局部观测做出独立决策。
全文数据:
权利要求:
百度查询: 中国人民解放军国防科技大学 一种基于强化学习模型的机器人群体协调方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。