一种基于强化学习的取送货车辆路径规划方法

导航：龙图腾网> 最新专利技术> 一种基于强化学习的取送货车辆路径规划方法

申请/专利权人：华南理工大学

申请日：2021-11-16

公开（公告）日：2024-06-21

公开（公告）号：CN114237222B

主分类号：G05D1/43

分类号：G05D1/43;G05D1/644;G05D109/10

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2022.04.12#实质审查的生效;2022.03.25#公开

摘要：本发明公开了一种基于强化学习的取送货车辆路径规划方法。所述方法包括以下步骤：构建基于A2C框架的强化学习模型及其优化目标；初始化强化学习模型所有的参数值，随机生成数据集；构建强化学习模型的训练过程，将生成的数据集输入强化学习模型，计算每一轮训练结果的奖励值；根据损失值采用基于策略梯度的强化学习方法对强化学习模型进行优化；设置最大训练轮数，重复训练得到训练完成的强化学习模型，采用训练完成的强化学习模型进行取送货车辆路径规划。本发明不同于传统的精确算法和启发式算法，能够快速求解大规模路径规划问题。

主权项：1.一种基于强化学习的取送货车辆路径规划方法，其特征在于，包括以下步骤：S1：构建基于A2C框架的强化学习模型及其优化目标；强化学习模型包括actor网络和critic网络；actor网络包括第一编码器、解码器和注意力层；第一编码器用来处理输入的所有取货点和送货点的坐标、当前车辆载重和当前所有取货点的取货量和送货点的送货量，输入编码器的数据经过第一编码器中的卷积层得到第一向量embed_1；解码器用来处理当前车辆所在节点的坐标，输入解码器的数据经过解码器中的卷积层和GRU层得到第二向量embed_2；注意力层维护第一零矩阵v和第二零矩阵W，把第一向量embed_1和第二向量embed_2相加，连接起来得到第三向量hidden，进行操作得到概率矩阵p＝softmaxv·tanhW·hideen；在解码器的GRU层中加入dropout操作；critic网络包括第二编码器和全连接层，第二编码器用来处理输入的所有取货点和送货点的坐标、当前车辆载重和当前所有取货点的取货量和送货点的送货量，将输入经过第二编码器中的卷积层得到第三向量embed_3；全连接层将第三向量embed_3作为输入，全连接层包括多个卷积层，全连接层中使用ReLU激活函数去除每个卷积层输出中的负值；S2：初始化强化学习模型所有的参数值，随机生成数据集；S3：构建强化学习模型的训练过程，将步骤S2中生成的数据集输入强化学习模型，计算每一轮训练结果的奖励值；S4：根据损失值采用基于策略梯度的强化学习方法对强化学习模型进行优化；S5：设置最大训练轮数，重复步骤S3-步骤S4，得到训练完成的强化学习模型，采用训练完成的强化学习模型进行取送货车辆路径规划。

全文数据：

权利要求：

百度查询：华南理工大学一种基于强化学习的取送货车辆路径规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种便于移动的展开式箱房

下一篇：一种两级压缩螺杆式空压机壳体

相关技术

一种便于移动的展开式箱房

一种两级压缩螺杆式空压机壳体

一种可控制持握角度的羽毛球拍

一种具有固定结构的快客杯

一种微型制冷压缩机

建筑工程管理招标装置

一种口腔扩张支撑装置

一种锂电池外壳冲压设备

一种船舶圆形管件紧固装置

自穿刺铆钉、电池及用电设备

一种升降式饺子加工压面机

一种监测作物生长状况的农业装置

车辆相关技术

车辆_株式会社斯巴鲁_202311604379.2

车辆前部结构及车辆_苏州时代新安能源科技有限公司_202211698098.3

车辆_丰田自动车株式会社_202311813639.7

车辆_浙江极氪智能科技有限公司_202211701704.2

车辆仪表组件以及车辆_标致雪铁龙汽车股份有限公司_202211688668.0

车辆_北京百度网讯科技有限公司_202323244698.5

车辆_丰田自动车株式会社_202311444249.7

车辆_丰田自动车株式会社_202311806411.5

车辆_广州汽车集团股份有限公司_202322593622.7

车辆热管理系统以及车辆_比亚迪股份有限公司_202310910024.X

送货相关技术

一种基于强化学习的取送货车辆路径规划方法_华南理工大学_202111355807.3

一种公交线网辅助下的无人机取送货调度方法、系统及存储介质_南京智慧交通信息股份有限公司_202410658105.X

一种货仓以及送货机器人_深圳市诺丰泰智能科技有限公司_202323041767.2

一种混凝土送货取票机_重庆新智和科技有限公司_202323095093.4

一种高度可调物流运送货篮_北京诚志军融科技有限公司_202322904451.5

基于历史信息嵌入的取送货路径规划方法及系统_中南大学_202410286402.6

一种医院用智能送货AGV小车及其送货方法_合肥工业大学_202210223195.0

一种不堵塞机动车道的移动仓库送货系统_杭州容大智造科技有限公司_202211490547.5

用于配送货物保持器中容纳的货物的配送端口_自动存储科技股份有限公司_202280069282.3

一种送货用无人机快递_周欢东_202010134013.3

取相关技术

取栓支架、取栓装置及取栓系统_杭州德诺脑神经医疗科技有限公司_202011281597.3

取栓装置及取栓系统_杭州德诺脑神经医疗科技有限公司_202011280222.5

一种取芯设备以及取芯工艺_墨脱县墨脱石锅文化产业有限公司_201810900261.7

变距取放装置_万润科技精机(昆山)有限公司_202323071526.2

控制预取式FIFO的方法、预取式FIFO装置及芯片_瑞芯微(北京)集成电路有限公司_202410302466.0

一种分离金属钯的浸取剂及其制备与浸取方法_山东大学_202310252262.6

一种取力器和油泵集成的取力装置_苏州绿控传动科技股份有限公司_202323164248.5

取章机构及用印机_北京东方金鹰信息科技股份有限公司_201811252573.8

晶圆拾取组件_苏州联讯仪器股份有限公司_202323105556.0

便于取放物品的隔音箱_利发环保科技(昆山)有限公司_202211681433.9

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

一种基于强化学习的取送货车辆路径规划方法

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务