一种基于强化学习模型的机器人群体协调方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：中国人民解放军国防科技大学

摘要：本发明公开了基于强化学习模型的机器人群体协调方法，包括以下步骤：每个机器人被隐马尔科夫模型分配角色；机器人i将历史观测和动作编码成机器人i轨迹τi，来自机器人i和轨迹τi的观测值被送入强化学习网络；所述强化学习网络为角色分配效用矩阵，对效用矩阵进行张量环分解后，动态调整秩的大小，以优化单个机器人的局部效用；单个机器人的局部效用优化之后，所述强化学习网络对机器人i轨迹τi局部观测通过误差正则项和惩罚正则项进行优化；每个机器人根据优化后的局部观测做出独立决策。本申请动态调整张量秩的大小，使得单个无人机的局部效用得到优化；对无人机通过全局信息对局部观测优化，从而对无人机进行统一协调。

主权项：1.一种基于强化学习模型的机器人群体协调方法，其特征在于，包括以下步骤：每个机器人被隐马尔科夫模型分配角色；机器人i将历史观测和动作编码成机器人i轨迹τi，来自机器人i和轨迹τi的观测值被送入强化学习网络；所述强化学习网络为角色分配效用矩阵，对效用矩阵进行张量环分解后，动态调整秩的大小，以优化单个机器人的局部效用；单个机器人的局部效用优化之后，所述强化学习网络对机器人i轨迹τi局部观测通过误差正则项和惩罚正则项进行优化；每个机器人根据优化后的局部观测做出独立决策。

全文数据：

权利要求：

百度查询：中国人民解放军国防科技大学一种基于强化学习模型的机器人群体协调方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种低压开关柜

下一篇：一种带式输送机撒料治理装置

相关技术

一种低压开关柜

一种带式输送机撒料治理装置

一种红外水平仪的放置底座

一种畜牧用防疫架

一种废旧电池回收系统及其回收方法

一种舌肌训练装置

一种带有检测功能的数控机床用刀库

全塑壳防静电吹尘枪

一种电加热结构及带有该电加热结构的家用电器

一种可控流量的自动倒袋装置

一种储物筐可调节的电动购物车

一种石墨模具模架

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于强化学习模型的机器人群体协调方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务