【发明公布】一种基于偏好驱动的多目标强化学习的车辆路线规划方法_东北大学_202410305490.X

导航：龙图腾网> 最新专利技术> 一种基于偏好驱动的多目标强化学习的车辆路线规划方法_东北大学_202410305490.X

申请/专利权人：东北大学

申请日：2024-03-18

公开（公告）日：2024-06-14

公开（公告）号：CN118195457A

主分类号：G06Q10/0835

分类号：G06Q10/0835;G06N3/092;G06F18/20

优先权：

专利状态码：在审-公开

法律状态：2024.06.14#公开

摘要：本发明提供一种基于偏好驱动的多目标强化学习的车辆路线规划方法，涉及车辆规划以及深度强化学习技术领域。本发明通过将问题建模为马尔科夫决策过程，引入了偏好向量，从而赋予决策者更灵活的决策空间，通过与物流系统环境的交互，学习一组帕累托最优的车辆路径策略，采用多维插值器对偏好向量进行投影，以进行偏好向量空间的归一化处理，提高了算法的收敛性，引入余弦相似项，用于度量偏好的相似程度，确保在学习过程中偏好的一致性和对齐性，这种算法不仅提供解决MOVRP问题的路径方案，还考虑了决策者对多个目标的个性化偏好，个性化的车辆路径规划方案将能够更好地适应不同决策者和物流环境的需求，提高整体效率与用户满意度。

主权项：1.一种基于偏好驱动的多目标强化学习的车辆路线规划方法，其特征在于，包括如下步骤：步骤1：对车辆路径规划的系统环境进行定义描述；步骤2：建立车辆路径规划的目标函数及约束条件；步骤3：将车辆路径规划表述为一个多目标的马尔可夫决策过程并定义马尔可夫决策过程中的各个元素；步骤4：根据马尔可夫决策过程，使用预测网络Q与环境交互收集样本，然后使用PD-MOVRP算法对目标网络Target-Q进行训练，得到训练完成的目标网络Target-Q；步骤5：利用训练完成的目标网络Target-Q和偏好向量得到车辆路线。

全文数据：

权利要求：

百度查询：东北大学一种基于偏好驱动的多目标强化学习的车辆路线规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种天馈增益控制方法、计算设备及存储介质_东方空间技术(山东)有限公司_202310888439.1

下一篇：拒绝服务攻击下合作竞争多智能体系统安全协同控制方法_北京航空航天大学_202210194476.8

相关技术

一种天馈增益控制方法、计算设备及存储介质_东方空间技术(山东)有限公司_202310888439.1

拒绝服务攻击下合作竞争多智能体系统安全协同控制方法_北京航空航天大学_202210194476.8

一种长距离通信的电网无人机巡检系统及方法_国网山东省电力公司金乡县供电公司_202310722098.0

一种数据处理方法、装置、设备及存储介质_中移信息技术有限公司_201911384128.1

耐甲苯蒸煮的无卤阻燃聚氨酯树脂及其制备方法、应用_太仓维龙化工有限公司_202210052548.5

雷达、雷达成像的方法、装置和无人驾驶汽车_北京行易道科技有限公司_201610942985.9

一种空煤气经导流缝隙预混后绕流多柱体均混的燃烧器_郑州釜鼎热能技术有限公司_202210090672.0

基于双目拍摄的输送带磨损状态检测方法和系统_中标慧安信息技术股份有限公司_202011559487.9

一种复合钎焊膏及其制备方法和应用_天诺光电材料股份有限公司_202210389688.1

一种联合内容缓存和传输路由的网络优化方法_北京邮电大学_202210989943.6

一种适用于液压多路阀的气密性检测装置_徐州阿马凯液压技术有限公司_202111585252.1

承载装置及半导体工艺设备_北京北方华创微电子装备有限公司_202011141991.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明公布】一种基于偏好驱动的多目标强化学习的车辆路线规划方法_东北大学_202410305490.X

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务