基于人工势场和PPO的多智能体航路规划方法和装置

导航：龙图腾网> 最新专利技术> 基于人工势场和PPO的多智能体航路规划方法和装置

买专利卖专利找龙图腾，真高效！查专利查商标用IPTOP,全免费！专利年费监控用IP管家,真方便！

申请/专利权人：西南交通大学

摘要：本申请涉及基于人工势场和PPO的多智能体航路规划方法和装置，包括对智能体涉及算法的原始参数进行初始化处理；筛选出智能体待执行的下一个动作；使用人工势场函数获取智能体执行动作后的新的状态值；如果满足预设条件，则根据策略网络为智能体制定行动策略；如果未满足预设条件，则对经验库进行管理，根据管理后的经验库对策略网络进行训练，使用训练后的策略网络为智能体制定行动策略。通过使用非确定性策略的算法，克服人工势场的局部最优问题，跳出局部最优点，具有较强的环境适应性和鲁棒性；同时借助积极经验回放方法，加快强化学习方法在避障和路径规划过程中的收敛速度。

主权项：1.基于人工势场和PPO的多智能体航路规划方法，其特征在于，所述基于人工势场和PPO的多智能体航路规划方法，包括：对智能体涉及算法的原始参数进行初始化处理；获取所述智能体的当前状态值，并通过最小误差熵卡尔曼滤波方法对信息误差进行处理，筛选所述智能体待执行的下一个动作，包括：当仅存在单个所述智能体时，获取所述智能体的当前状态值，并通过最小误差熵卡尔曼滤波方法对信息误差进行处理，将所述当前状态值输入策略网络，获取所述策略网络输出的动作概率，根据人工势场函数计算奖励函数，基于所述动作概率选出所述智能体待执行的下一个动作；存在至少两个所述智能体时，获取每个所述智能体的当前状态值，将所述当前状态值传输至中央控制器，获取所述中央控制器基于合引力最小的目标分配机制进行计算后的目标分配结果，根据所述人工势场函数计算所述奖励函数，再由所述策略网络输出动作概率，从动作概率集合中选出所述智能体待执行的下一个动作，其中，所述目标为至少两个所述智能体需要到达的多个目标位置，存在多种目标分配机制，所述合引力为每种目标分配机制下的所有所述智能体受到的引力之和；使用人工势场函数和经过误差处理后的传感器数值，获取所述智能体执行所述下一个动作后的新的状态值；如果满足预设条件，则输出对应所述智能体的策略网络，根据所述策略网络为所述智能体制定行动策略；如果未满足预设条件，则基于包括当前状态值、所述新的状态值、所述原始参数在内的参数集合对经验库进行管理，根据管理后的所述经验库对所述策略网络进行训练，对训练后的所述策略网络和预先构建的评价网络进行更新，使用更新后的所述策略网络为所述智能体制定行动策略，包括：将包括所述当前状态值、所述新的状态值、所述原始参数在内的参数集合存储在经验库内；当所述经验库存满时，基于所述经验库内存储的数据构建目标函数，基于所述目标函数对所述策略网络进行训练；对所述经验库内的数据按奖励值由大到小的顺序进行排序，提取高奖励经验列表，对所述高奖励经验列表进行扩充，得到积极经验库，使用所述积极经验库对训练后的所述策略网络进行二次训练。

全文数据：

权利要求：

百度查询：西南交通大学基于人工势场和PPO的多智能体航路规划方法和装置

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种用于MTS816实验的破碎试样收集装置及使用方法

下一篇：用于最大允许暴露缓解的用户设备报告

相关技术

一种用于MTS816实验的破碎试样收集装置及使用方法

用于最大允许暴露缓解的用户设备报告

一种适用于磁敏电流传感器的补偿系统及方法

一种用于智慧交通控制系统的交通预警方法

一种胶囊药粒干燥装置及其干燥方法

灯鼓、吊灯支架及吊灯

一种用于土壤检测的土壤钻孔取土装置

一种新型卧式悬臂节能两级泵

识别操作终端设备的手势的方法和终端设备

涡轮机部件或部件的组合件

任务分配方法、任务分配装置、介质及电子设备

一种路桥钢模结构强度优化方法

体相关技术

层叠体及层叠体的制造方法_富士胶片株式会社_202280093717.8

散粒体坡体的钻孔装备_王玉胜_202411276754.X

光学层叠体及光学层叠体的制造方法_日东电工株式会社_202380028977.1

共聚物、成型体和注射成型体_大金工业株式会社_202380028921.6

人工晶状体_爱博诺德(北京)医疗科技股份有限公司_201710296026.9

胫骨假体_北京爱康宜诚医疗器材有限公司_202411261890.1

髋臼假体_北京爱康宜诚医疗器材有限公司_202411396826.4

等离子体仪器_爱尔博电子医疗仪器公司_202410511002.0

聚酰亚胺树脂前体_东京应化工业株式会社_202380027322.2

金属制有底筒体_东洋制罐株式会社_202380028603.X

智能相关技术

智能柜_广东睿住智能科技有限公司_202420301085.6

智能眼镜_珠海莫界科技有限公司_202420441377.X

智能眼镜_维沃移动通信有限公司_202211052025.7

智能眼镜_珠海莫界科技有限公司_202420328906.5

智能车牌_纬创资通股份有限公司_202310604593.1

智能眼镜及操作智能眼镜的方法_三星电子株式会社_202210812821.X

一种智能巡检设备及智能巡检系统_中国联合网络通信集团有限公司_202420659042.5

智能控制系统及其智能控制的方法_蔡志峯_202410514614.5

智能开关_浙江正泰居家科技有限公司_202322895224.0

智能设备识别_苹果公司_202110625176.6

航路相关技术

一种考虑“三区”避障的航路网络规划方法及系统_南京航空航天大学_202211174507.X

车辆驱动所需电量的获取方法、导航路线获取方法、电子设备及计算机可读存储介质_重庆赛力斯新能源汽车设计院有限公司_202411094673.8

导航路线处理方法、装置、设备、存储介质及程序产品_浙江吉利控股集团有限公司_202411071815.9

一种用于船舶航行的自动避碰航路规划方法_湖南湘船重工有限公司_202411356153.X

一种无人机降落航路规划方法、装置、设备、介质及产品_天目山实验室_202411375346.X

基于人工势场和PPO的多智能体航路规划方法和装置_西南交通大学_202411156553.6

降低驾驶操作难度的导航路线规划方法_安徽江淮汽车集团股份有限公司_202410937188.6

一种大型水陆两栖飞机搜救救援航路规划方法和装置_中航通飞华南飞机工业有限公司_202211291778.3

动态环境下基于AIS数据的多目标船舶航路规划方法_中电科(宁波)海洋电子研究院有限公司_202210337025.5

为车辆的自动驾驶操作确定导航路线的方法_梅赛德斯-奔驰集团股份公司_202280093309.2

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

基于人工势场和PPO的多智能体航路规划方法和装置

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务