买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京蔚行科技有限公司;交通运输部科学研究院
摘要:本发明公开了一种基于时间序列聚类的公交运营时段划分方法,从历史运营记录中提取公交线路的行程时间数据,按发车时刻统计不同时间点对应的行程时间数据集;基于各数据集的特征,使用多中心聚类法将具有相似特征的时间点归为一类;得到聚类结果后,根据数据集对应的时间标签,按先后顺序将同类的样本点进行合并,进而得到运营时段的划分结果。本发明方法利用行程时间来刻画公交运营时段特征,数据获取简便易行,实现了基于运营特征的时段划分,能够有效帮助提高公交运营准点性、提升服务水平,具备实际应用价值。
主权项:1.基于时间序列聚类的公交运营时段划分方法,其特征在于,包括以下步骤:步骤1:输入公交线路的行程时间数据和对应的发车时刻,根据线路服务水平要求设置同时段行程时间的允许标准偏差和公交运营时段最小长度,作为时段划分参数;时段划分参数包括同时段内的行程时间前向标准偏差δ-、后向标准偏差δ+、公交运营时段最小长度Tmin;若某一数据集合为X={x1,x2,x3,…,xn-,xn},中位数为m,小于中位数的数据集合为X-={xi|xim,xi∈X},大于中位数的数据集合为X+={xi|xim,xi∈X},则前向偏差σ-为:后向偏差σ+为此处|*|表示集合的元素数量,而前向标准偏差δ-、后向标准偏差δ+分别为前向偏差和后向偏差的标准值,前向标准偏差δ-、后向标准偏差δ+表示了行程时间数据的波动范围;步骤2:按发车时刻统计行程时间数据集:具有相同发车时刻的行程时间数据归入同一数据集,将发车时刻记为该数据集对应的时间戳;统计各数据集的中位数,并各数据集转化为中位数与时间戳表示的样本特征点;各样本特征点对应不同的发车时间戳,且发车时间戳按“小时:分钟”即HH:MM格式计,所有发车时间戳代表了目标线路全天运营时间段;步骤3:使用处理得到的所有样本特征点进行多中心聚类,不预设聚类中心数量,而是通过对样本特征点的分析、迭代和更新找到最合适聚类中心数,进而得到样本特征点的聚类结果;所述多中心聚类的具体过程如下:3.1输入样本特征点集S,初始聚类中心数m=1,并从所有样本特征点中随机选择一个作为初始聚类中心c1;3.2依次计算所有样本特征点s∈S与各聚类中心ci,i=1,2…,m间的距离差:Ds={dsi=|s-ci||i=1,2…,m},然后将样本特征点s∈S归入距离最近的中心i所对应的类别中,i=argminDsi;3.3所有样本特征点完成归类后,将各类所包含的样本特征点中位数设置为该类新的聚类中心,并与更新前的聚类中心对比;若存在某聚类中心位置发生变化,则返回步骤3.2,否则转至步骤3.4;3.4各聚类中心不再变化后,计算各类中样本特征点对应的所有原行程时间数据集的前向偏差和后向偏差:若所有类对应的行程时间数据集合均满足σ-≤δ-且σ+≤δ+,则聚类完成输出聚类结果,即每个样本特征点将新增一个类别标签;否则,令聚类中心数m=m+1并随机选择一个样本特征点作为新增类的聚类中心,然后返回3.2;步骤4:根据聚类结果,对样本特征点进行基于时间顺序的合并:每个样本特征点对应一个类别标签和一个时间戳标签,先按时间戳顺序对所有样本特征点进行排序,然后在得到的序列中,若相邻两个样本特征点拥有相同的类别标签,则合并至同一个时段;合并完成后,检验是否存在某时段的长度小于步骤1中设置的公交运营时段最小长度值Tmin,将其与前一时段或后一时段进行合并;若存在某时段的长度小于Tmin需要进一步合并时,需分别计算该时段与前一时段或后一时段合并的情况下,所得新时段内对应的行程时间数据集的前向偏差和后向偏差:若向前一时段合并所得的前向偏差和后向偏差均小于向后一时段合并所得的前向偏差和后向偏差,则与前一时段合并;若向后一时段合并所得的前向偏差和后向偏差均小于向前一时段合并所得的前向偏差和后向偏差,则与后一时段合并;否则计算两种情况下所得的前向偏差和后向偏差之和,与前向偏差和后向偏差之和较小的时段合并;若存在多个时段长度小于Tmin,则按照时段长度由小到大的顺序依次进行合并;若不存在,则时段划分完成,输出结果。
全文数据:
权利要求:
百度查询: 北京蔚行科技有限公司 交通运输部科学研究院 基于时间序列聚类的公交运营时段划分方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。