首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于机器学习的考虑司机异质性的路径规划方法_中国科学技术大学_202410326156.2 

申请/专利权人:中国科学技术大学

申请日:2024-03-21

公开(公告)日:2024-06-21

公开(公告)号:CN117933869B

主分类号:G06Q10/0835

分类号:G06Q10/0835;G06Q30/0601;G06Q10/0631;G06N20/00

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2024.05.14#实质审查的生效;2024.04.26#公开

摘要:本发明公开了一种基于机器学习的考虑司机异质性的路径规划方法,首先基于最大化一段运营时间内的平台长期收益,构建按需配送优化模型;使用基于机器学习的两阶段分类预测算法,训练预测模型以预测实时订单的类别;求解建立的按需配送优化模型,获得该车辆路径规划问题的最优解和最优策略。该方法能有效地提高订单分配效率,并实现对新司机的激励,为物流服务提供商提供了一种权衡效率与公平的工具。

主权项:1.一种基于机器学习的考虑司机异质性的路径规划方法,其特征在于,所述方法包括:步骤1、基于最大化一段运营时间内的平台长期收益,构建按需配送优化模型;其中,在步骤1中,首先考虑新司机激励的按需配送问题,将该问题定义为异构车辆的随机动态取货和交付问题,在服务区域G内,由新司机和普通司机构成的异构车队在一段时间内为顾客提供按需配送服务,已知下单时间分布的顾客请求在一天的服务时间内随机到达,每个订单请求都关联着一个取餐点、一个送餐点、一个预期配送时长约束和一个预期延迟容忍时长;每个订单的预计配送时间由平台预测得到并告知顾客,取餐服务时间和送餐服务时间均为;车辆的初始地点在服务区内随机产生并在最后的服务地点结束服务,并假设司机按照平台的建议确定自己配送顺序和路径,并且不能拒绝指派的订单;假设两种类型司机的配送时间的不同体现在取餐地点和送餐地点服务时间的差异,假设新司机配送每个订单比普通司机额外花费的取餐和送餐服务时间均为均值为的常量;假设平台为新司机提供激励的平均每单成本为;再将车辆路径规划问题的决策过程转化为多目标的马尔可夫决策过程模型,所述马尔可夫决策过程模型包含五个要素:系统状态、决策变量、奖励与外生信息、状态转移和目标函数,其中:决策点,是决策者需要执行决策动作的时间点,决策者在第个新顾客到达的时间时做出决策;系统状态,表示为元组,系统状态包含在当前时间,即决策点做出决策所需要的信息,这些信息包括当前时间、新请求、尚未服务的订单集合、餐厅集和路线计划;车辆集表示为,每个车辆对应一条路径,每条路径所包含的信息有:车辆的起点和目的地、当前的路线计划、订单的估计交付时间、订单的期望交付时间和车辆属性;初始状态是在且时,,即初始决策时间从一天中的第0分钟开始,所以,三个空集表示顾客集、尚未服务的订单集和餐厅集都为空集,此时没有顾客、尚未服务的订单和依据偏好排序的顾客准备下单的备选餐厅集合列表;其中,初始路线计划中每个车辆路径仅包含初始停车点;决策变量为;用表示一组决策变量,表示其中的一个决策变量,为个备选餐厅,更新暂定路线,并计算此路线的预计到达时间,将传达给客户,满足客户配送时长约束的配送服务将被接受;具体实现中,每个和是一个维的向量,调度员为区域内现有车辆试探性地更新临时可行路径并计算路径代价,按照订单插入代价最小的原则选择司机路线,并计算其预计配送时间返回给客户;外生信息包括当前客户对餐厅的选择,客户依据个人偏好函数决定对餐厅的选择,偏好函数以每个餐厅预计配送时长输入,结合预期配送时长约束,选择下单的餐厅或者拒绝点餐;表示客户是否接受平台提供的服务,表示客户接受平台提供的服务,表示当前订单的流失;因此在决策点及状态,系统做出决策,并根据客户的选择更新路径计划,导致决策后状态;此时实现奖励;此外,外生信息还包括潜在新客户订单的到达或决策过程的终止;奖励函数为;其中,每个决策关联着一个奖励,表示平台服务订单获得的收入,奖励函数计算公式为:;其中,为平台配送的每单收入;为每分钟延迟成本;为延迟时长,且,为实际配送时间,为下单前的预期配送时长容忍约束,为配送结束后顾客的预期延迟容忍时长;表示该订单由新司机的车辆装载并服务;是平台激励新司机配送的平均每单激励成本;状态转移函数表示为;当下一个顾客的请求到达时,会引起系统状态从过渡到;此时系统时间为决策点;尚未服务的顾客集合取决于外生信息和路径决策;餐厅取决于顾客的选择;通过移除所有到达时间小于的取送点截断路线,得到路线计划;当系统时间,即决策点大于服务时间的结束时刻时,决策过程终止;该马尔可夫决策过程模型的解决方案是确定一个策略,为每个系统状态指导决策行为,目标是找到一种策略,使初始状态开始时的预期总收益最大化: ;其中,表示在系统状态时,根据策略做出的决策;表示系统初始状态;步骤2、使用基于机器学习的两阶段分类预测算法,训练预测模型以预测实时订单的类别;步骤3、求解步骤1建立的按需配送优化模型,获得车辆路径规划问题的最优解和最优策略。

全文数据:

权利要求:

百度查询: 中国科学技术大学 一种基于机器学习的考虑司机异质性的路径规划方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。