【发明公布】一种基于分层强化学习的无人机动态任务分配方法及装置_中国电子科技集团有限公司电子科学研究院_202410037582.4

申请/专利权人：中国电子科技集团有限公司电子科学研究院

申请日：2024-01-10

公开（公告）日：2024-04-26

公开（公告）号：CN117933622A

主分类号：G06Q10/0631

分类号：G06Q10/0631;G06N3/045;G06N3/092

优先权：

专利状态码：在审-实质审查的生效

法律状态：2024.05.14#实质审查的生效;2024.04.26#公开

摘要：本发明提出了一种基于分层强化学习的无人机动态任务分配方法及装置，方法包括：对任务分配场景进行建模；在每预设数量的时间步数收集各个执行器的观测信息，利用配置的协调者算法，进行全局的任务分配，并将分配结果传输给执行器，以使得上层的协调者累计奖励函数最大化；利用配置的执行器算法，使得执行器通过采取动作以完成分配结果对应的任务，在最短的时间步内到达任务节点，以使得下层的执行器累计奖励函数最大化；对协调者累计奖励函数以及执行器累计奖励函数进行迭代，使得上层及下层函数分别达到累计最大值。本发明使用强化学习算法进行求解，能够提高时间约束下的系统整体任务完成度，解决大规模任务分配带来的维度爆炸的问题。

主权项：1.一种基于分层强化学习的无人机动态任务分配方法，其特征在于，包括：S1、对任务分配场景进行建模，其中，控制端作为上层的协调者，无人机作为下层的执行器；S2、在每预设数量的时间步数收集各个所述执行器的观测信息，利用配置的协调者算法，进行全局的任务分配，并将分配结果传输给执行器，以使得上层的协调者累计奖励函数最大化；S3、利用配置的执行器算法，使得所述执行器通过采取动作以完成所述分配结果对应的任务，在最短的时间步内到达任务节点，以使得下层的执行器累计奖励函数最大化；S4、对所述协调者累计奖励函数以及所述执行器累计奖励函数进行迭代，使得上层及下层函数分别达到累计最大值。

全文数据：

权利要求：

百度查询：中国电子科技集团有限公司电子科学研究院一种基于分层强化学习的无人机动态任务分配方法及装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：为放大器操作进行的平台资源的选择_超威半导体公司_202280065509.7

下一篇：锂电池管理单元及管理方法_深圳市车电网络有限公司_202410101072.9

相关技术

为放大器操作进行的平台资源的选择_超威半导体公司_202280065509.7

锂电池管理单元及管理方法_深圳市车电网络有限公司_202410101072.9

一种热升华水性油墨及其制备方法_广东睿智环保科技股份有限公司_202410410854.0

全氟异丁腈的合成方法_天津市长芦化工新材料有限公司_202410424719.1

无机人造石脱模剂及其制备方法和无机人造石的制备方法_深圳市润丰新材料科技有限公司_202410151462.7

重组人白介素2（I）的应用_山东泉港药业有限公司_202410417266.X

一体集成微同轴气密封装结构及其制造方法_中国电子科技集团公司第十三研究所_202410148673.5

一种靶向性介孔聚多巴胺纳米颗粒及其制备方法和应用_中国药科大学_202410163612.6

网站类别的识别方法及装置、设备、存储介质_中国移动通信集团有限公司_202311640121.8

一种基于视觉和图像处理的叉车AGV控制系统_中建材智能自动化研究院有限公司_202410146298.0

一种茭白废弃叶多糖组分及其制备方法和用途_常熟理工学院_202410158334.5

一种基于氟硼荧的离子型多孔有机聚合物及其制备方法和光催化应用_常州大学_202311787384.1

龙图腾网&IPTOP

【发明公布】一种基于分层强化学习的无人机动态任务分配方法及装置_中国电子科技集团有限公司电子科学研究院_202410037582.4

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务