申请/专利权人:北京航空航天大学
申请日:2022-07-14
公开(公告)日:2024-06-14
公开(公告)号:CN115047912B
主分类号:G05D1/695
分类号:G05D1/695;G05D109/20
优先权:
专利状态码:有效-授权
法律状态:2024.06.14#授权;2022.09.30#实质审查的生效;2022.09.13#公开
摘要:本发明涉及一种基于强化学习的无人机集群自适应自重构方法及系统,涉及无人机集群领域,该方法包括:初始化多个无人机智能体模型;构造局域对抗仿真环境;仿真环境包括虚拟物理引擎;虚拟物理引擎用于驱动各无人机智能体模型按照物理规律进行仿真飞行;在局域对抗仿真环境中施加设定外加扰动;在仿真飞行的过程中,基于多智能体强化学习模型,根据各无人机智能体模型当前时刻获得的观察信息生成下一时刻的联合动作决策,并根据下一时刻的观察信息和即时奖励训练多智能体强化学习模型中的神经网络;在每个时刻,根据生成的联合动作决策重构无人机集群,为每个打击目标分配设定数量的无人机智能体模型。本发明提高了无人机集群的可靠性。
主权项:1.一种基于强化学习的无人机集群自适应自重构方法,其特征在于,包括:根据无人机集群参数初始化多个无人机智能体模型;构造局域对抗仿真环境;所述局域对抗仿真环境包括通过障碍物边界圈定的设定区域范围、虚拟物理引擎和打击目标;所述虚拟物理引擎用于驱动各所述无人机智能体模型按照物理规律进行仿真飞行;使各所述无人机智能体模型生成的无人机集群在所述局域对抗仿真环境中飞行,并在所述局域对抗仿真环境中施加设定外加扰动;在各所述无人机智能体模型仿真飞行的过程中,基于多智能体强化学习模型,根据各所述无人机智能体模型当前时刻获得的观察信息生成下一时刻的联合动作决策,并根据下一时刻的观察信息和即时奖励训练所述多智能体强化学习模型中的神经网络;所述神经网络用于根据整体观察信息输出联合动作决策;所述整体观察信息为各所述无人机智能体模型获得的观察信息的总和;在每个时刻,根据所述多智能体强化学习模型生成的所述联合动作决策重构无人机集群,并根据当前无人机集群和整体观察信息,为每个打击目标分配设定数量的所述无人机智能体模型,各所述无人机智能体模型对对应所述打击目标进行打击。
全文数据:
权利要求:
百度查询: 北京航空航天大学 一种基于强化学习的无人机集群自适应自重构方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。