基于双向深度强化学习的多无人船协同围捕训练方法

导航：龙图腾网> 最新专利技术> 基于双向深度强化学习的多无人船协同围捕训练方法

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：哈尔滨工业大学(威海);威海天帆智能科技有限公司

摘要：本申请属于无人船智能控制技术领域，提供一种基于双向深度强化学习的多无人船协同围捕训练方法，包括以下步骤：建立基于深度强化学习的多无人船的协同围捕模型，所述协同围捕模型包括至少一个基于深度强化学习的围捕策略网络；建立机动目标的逃逸模型，所述逃逸模型包括至少两个非智能逃逸子模型以及至少一个基于深度强化学习的逃逸策略网络；对所述协同围捕模型及逃逸模型进行多任务双向深度强化学习训练，所述多任务双向深度强化学习训练包括至少三次正向训练任务以及至少一次反向训练任务。本申请提供的方法通过对深度强化学习训练方式进行优化，能够迅速提升多个无人船对各类机动目标进行高效协同围捕的能力。

主权项：1.一种基于双向深度强化学习的多无人船协同围捕训练方法，其特征在于，包括以下步骤：建立基于深度强化学习的多无人船的协同围捕模型，所述协同围捕模型包括至少一个基于深度强化学习的围捕策略网络；建立机动目标的逃逸模型，所述逃逸模型包括至少两个非智能逃逸子模型以及至少一个基于深度强化学习的逃逸策略网络；对所述协同围捕模型及逃逸模型进行多任务双向深度强化学习训练，所述多任务双向深度强化学习训练包括至少三次正向训练任务以及至少一次反向训练任务，其中，所述机动目标在执行各次正向训练任务时分别使用所述逃逸模型中的至少两个非智能逃逸子模型以及至少一个逃逸策略网络对所述协同围捕模型进行深度强化学习训练，且机动目标在各次正向训练任务中的逃逸轨迹复杂程度依次提高；各个无人船在执行所述反向训练任务时基于已训练的协同围捕模型对所述至少一个逃逸策略网络进行深度强化学习训练，且最后一次反向训练任务先于最后一次正向训练任务被执行。

全文数据：

权利要求：

百度查询：哈尔滨工业大学(威海) 威海天帆智能科技有限公司基于双向深度强化学习的多无人船协同围捕训练方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：金属燃料电池与其他类型蓄电池的协同应用系统及方法

下一篇：一种氧化亚硅负极材料及其制备方法

相关技术

金属燃料电池与其他类型蓄电池的协同应用系统及方法

一种氧化亚硅负极材料及其制备方法

重油加氢装置平稳运行控制参数的确定方法及装置

无线信道模型的更新方法、装置、设备及存储介质

一种多级循环递进式抽奖系统

一种基于FIFO处理CAN通信消息的优化系统及方法

沸点检测方法、装置、存储介质、程序产品和烹饪设备

一种碳纤维纺丝前驱体及碳纤维的生产方法

一种电子水泵噪声振动测试台架装置及噪声测试方法

一种正负可调叠加高频脉冲的电源

集中供暖设备

半导体器件及其制备方法

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于双向深度强化学习的多无人船协同围捕训练方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务