【发明授权】一种基于Q-learning的公交调度方法_西北大学_202410269459.5

导航：龙图腾网> 最新专利技术> 一种基于Q-learning的公交调度方法_西北大学_202410269459.5

申请/专利权人：西北大学

申请日：2024-03-11

公开（公告）日：2024-06-21

公开（公告）号：CN117875674B

主分类号：G06Q10/0631

分类号：G06Q10/0631;G06N3/042;G06N3/0464;G06N3/092;G06Q10/04;G06Q50/40

优先权：

专利状态码：有效-授权

法律状态：2024.06.21#授权;2024.04.30#实质审查的生效;2024.04.12#公开

摘要：本发明公开了一种基于Q‑learning的公交调度方法，包括以下步骤：步骤一，获取公交系统的历史运行数据；步骤二，根据历史运行数据得到预设时间内的预期客流量数据；步骤三，利用Q‑learning算法根据预期客流量数据构建得到调度模型；步骤四，将调度模型应用于实际的公交系统运行中。本申请提出的一种基于Q‑learning的公交调度方法，通过公交系统的历史运行数据进行预测得到预设时间内的预期客流量数据，再利用Q‑learning算法根据预期客流量数据构建得到调度模型，提高了采集数据与调度决策的相关度，并提高了公交调度的准确性。

主权项：1.一种基于Q-learning的公交调度方法，其特征在于，包括以下步骤：步骤一，获取公交系统的历史运行数据；步骤二，根据所述历史运行数据得到预设时间内的预期客流量数据；步骤三，利用Q-learning算法根据所述预期客流量数据构建得到调度模型；步骤四，将所述调度模型应用于实际的公交系统运行中；步骤三中，所述利用Q-learning算法根据所述预期客流量数据构建得到调度模型的步骤包括：创建Q矩阵，行表示状态，列表示动作；将Q矩阵的智能体表示为公交车辆，状态表示为各个公交线路的客流量，动作表示为选择某个时刻和某条公交线路进行发车；智能体遍历所有公交线路，智能体获取当前状态下动作组合的最大Q值，获取最大Q值对应的动作并执行，然后转移到下一个状态；采用所述预期客流量数据对所述Q矩阵进行训练，得到训练好的Q矩阵，即所述调度模型；步骤三中，所述采用所述预期客流量数据对所述Q矩阵进行训练包括：A，初始化当前状态为起始状态；B1，根据当前状态和Q矩阵，使用ε-greedy策略选择决策动作；B2，执行所述决策动作，得到新状态；B3，观察新状态和即时奖励；B4，将新的Q值更新到Q矩阵中；B5，将新状态设为当前状态；B6，若到达预设训练步数或到达终点状态，进入下一步骤，否则回到步骤B1；C，若到达预设训练次数，训练完成，否则回到步骤A；步骤B3中，所述即时奖励是通过预设计的奖励函数得到；所述奖励函数包括：运营收入奖励函数、运营成本奖励函数和乘客时间成本奖励函数；运营收入奖励函数如下式：其中，表示运营收入；k表示站点j的乘客数量；s表示票价；运营成本奖励函数如下式：其中，表示运营成本；表示当前站点i与站点j之间的运营成本；表示站点i与站点j的距离；p表示单位油耗费用；n表示站点的个数，发车场点记为第0个站点，停车场点记为第n+1个站点；乘客时间成本奖励函数如下式：其中，表示乘客时间成本；表示站点j的乘客的时间成本；表示公交车到达站点j的实际时间；为站点j时间窗的最晚时间；为乘客的时间价值，即预先设置的乘客乘坐公交所节约时间对应的价值；为正数，用于避免分母为0；奖励函数如下式：步骤B4中，使用Q-learning更新策略进行Q值更新；首先定义记忆矩阵来依次记录智能体所经历过的所有状态st与相应动作at；设记忆矩阵为h行2列的矩阵，其中，h表示从初始时刻到当前时刻所经历的状态数量；以记忆矩阵中的为索引找到前一个“状态-动作”所对应的Q值并更新；然后令t减1，并判断t-1是否为0；如果为0，说明状态st前面所经历过的所有“状态-动作”的Q值已更新完毕；如果不为0，则寻找其下一个“状态-动作”的Q值进行更新，直至所有Q值更新完毕；Q-learning更新策略如下式：其中，表示状态采取动作后更新的Q值；表示g时刻的状态；表示状态采取的动作；表示状态采取动作获得的即时奖励；为折扣系数，表示状态采取动作a可获得的最大Q值；步骤四包括：获取公交系统的实时运行数据；进而，得到对应所述实时运行数据的预期客流量数据并输入所述调度模型，输出调度决策；将对应所述实时运行数据的预期客流量数据作为调度模型的当前状态，选择具有最大Q值的动作作为决策动作，即调度决策；根据所述调度决策进行实际调度。

全文数据：

权利要求：

百度查询：西北大学一种基于Q-learning的公交调度方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息，力求客观、公正，但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解，仅供参考使用，不能作为本公司承担任何法律责任的依据或者凭证。

阅读全文双屏查看官方信息专利公告收藏专利下载PDF 下载WORD

上一篇：一种移动式自填充胶枪_成都澳诺科技有限公司_202321885467.X

下一篇：一种护理液调和储存罐_刘静姝_202323358912.X

相关技术

一种移动式自填充胶枪_成都澳诺科技有限公司_202321885467.X

一种护理液调和储存罐_刘静姝_202323358912.X

一种监测作物生长状况的农业装置_重庆市骏驰农产品加工有限公司_202323312778.X

一种模具加工用定位装置_吉林省赫铭精密技术有限公司_202421162893.5

一种芦笋种植用废料混合装置_山东华农芦笋科技有限公司_202322322109.4

一种高层建筑双水系统分布式空调热交换装置_吉林省利沣新能源科技集团有限公司_202323209112.1

一种高弹性一体编织鞋面_东莞市大群纺织有限公司_202323394135.4

一种散热机箱_陈浩鸿_202323181374.1

一种牛场用饲喂推料机_西北农林科技大学_202322445421.2

一种具有分级过滤功能的纳滤膜元件_靖州玉华泉饮料有限公司_202323190804.6

一种用于消毒的泵芯组装机_宁波鑫航自动化科技有限公司_202420236725.X

一种中空建筑模板送料调节装置_苏州为华环保科技有限公司_202323342582.5

Q-learning相关技术

具备多谐振峰高Q值的太赫兹超材料传感器_南京航空航天大学_202410328206.0

一种基于单井微测井资料的表层等效Q值求取方法_东北石油大学_202410383240.8

基于q轴电压反馈的变流器锁相同步稳定控制方法及系统_山东大学_202410450089.5

一种易焊接高强韧Q690F钢板的生产方法_包头钢铁(集团)有限责任公司_202410449414.6

一种基于椭圆孔的高Q值硅基光子晶体环形腔优化方法_中国地质大学(武汉)_202211024473.6

一种高Q_m的<111>取向四元织构陶瓷及其三步烧结制备方法_哈尔滨工业大学_202310132060.8

含辅酶Q10的牙膏及其制备方法_广东润和生物科技有限公司_202410120673.4

一种低温抗延性断裂X60Q管线管制造方法_包头钢铁(集团)有限责任公司_202410229985.9

在具有复杂谐振电路的无线充电系统中确定Q因数_恩智浦美国有限公司_201811606827.1

一种高精度近地表Q值求取方法和装置_中国石油天然气股份有限公司_202211670526.1

调度相关技术

多维并行调度方法_北京蓝耘科技股份有限公司_202410005883.9

会议调度方法及装置_华为技术有限公司_202310243383.4

一种数据中心的资源调度方法及系统、调度设备、介质_深圳供电局有限公司_202110597755.4

微服务的调度方法、调度装置和业务处理系统_广东电网有限责任公司_202410231198.8

基于电力调度的碳排放权配额调度方法、装置和设备_南方电网能源发展研究院有限责任公司_202310432545.9

模型参数的调度方法及装置_苏州元脑智能科技有限公司_202410532218.5

虚拟机调度方法和装置_中国电信股份有限公司_202110175752.1

利用多PDSCH调度对PUCCH进行功率控制调整_欧芬诺有限责任公司_202280067557.X

模组加压静置线体及其调度方法_宁德时代新能源科技股份有限公司_202410179351.7

任务调度方法、装置、设备、存储介质及车辆_北京罗克维尔斯科技有限公司_202211674205.9

方法相关技术

编译方法、运行方法及相关产品_中科寒武纪科技股份有限公司_202211700640.4

参数控制方法以及曝光方法_上海交通大学_202410383008.4

测试单元及形成方法、测试结构及形成方法、测试方法_中芯国际集成电路制造(上海)有限公司_202211698757.3

预测模型生成方法、预测方法、设备和介质_博泰车联网科技(上海)股份有限公司_202211724925.1

获取方法、训练方法、任务处理方法及相关装置_浙江大华技术股份有限公司_202410693597.6

水文模型结构诊断方法、径流预报方法及装置_武汉大学_202111312143.2

掩模图像生成方法、检查方法以及检查装置_日立安斯泰莫株式会社_202280076511.4

分类模型训练方法以及分类方法_腾讯科技(深圳)有限公司_202210102315.1

建模方法及利用该建模方法的多类目标签的目标检测方法_小红书科技有限公司_202211695489.X

铁水的制造方法_杰富意钢铁株式会社_202280076058.7

龙图腾网&IPTOP

设置信息完成注册

手机号绑定多个账号

【发明授权】一种基于Q-learning的公交调度方法_西北大学_202410269459.5

专利交易买卖与高校科技成果转化平台

专利交易

快速入口

知产工具

关于我们

咨询服务