首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种利用手机数据识别跨城通勤人群的方法 

申请/专利权人:北京工业大学

申请日:2022-03-17

公开(公告)日:2024-06-04

公开(公告)号:CN114611622B

主分类号:G06F18/2431

分类号:G06F18/2431;G06F18/214;G06Q50/26;H04W4/021

优先权:

专利状态码:有效-授权

法律状态:2024.06.04#授权;2022.06.28#实质审查的生效;2022.06.10#公开

摘要:本发明公开了一种利用手机数据识别跨城通勤人群的方法,分为三部分,过程如下:一是获取已知用户类型的手机数据,每个数据集标记道路类型标签,对手机数据进行预处理,提取用户出行OD,筛选出有跨城出行行为的用户,获取数据集中相关用户出行指标,作为数据模型样本;二是构建决策树模型。利用k折交叉验证对决策树进行训练,通过比较每次的模型指标评分,确定最终人群类别识别模型;三是获取未知用户类型的手机数据,对手机数据进行预处理,提取用户出行相关指标,将该出行相关指标输入上一步得到的识别模型中,输出相应的用户类型标签,即识别出用户类型。

主权项:1.一种利用手机数据识别跨城通勤的方法,其特征在于:包括以下几个步骤:步骤1:获取已知用户类型的手机信令数据,手机信令数据包括用户编号、基站经度、基站纬度和信令记录产生时间;步骤2:对获取的手机信令数据进行预处理,识别用户停留点,进一步提取用户出行OD,并根据出行OD是否在同一城市;如果是同一城市则为同城出行,如果不是同一城市则为跨城出行;步骤3:根据步骤2中所提取的用户出行OD,删除掉所有出行中没有跨城出行行为的用户,即删除所有出行OD均在同一个城市的用户,筛选出有跨城行为的用户;步骤4:构建跨城行为的用户类别集合,C={c1,c2,c3},其中c1表示跨城周通勤人群,c2跨城日通勤人群,c1和c2统称为跨城通勤人群,c3表示非跨城通勤人群;定义所有训练集样本数据的类别标签,确定跨城通勤人群的高峰出行时段与高峰出行日期;步骤5:根据通勤出行的特点,获取各个手机用户出行指标,其中,包括周平均出行次数N,高峰时段出行占比Pg、高峰日期跨城出行比例Pd、工作日非高峰时段出行占比Pf、工作日出行占比Pw、跨城出行占比Pc;步骤6:将训练集分为k份,其中一份作为验证集,另外k-1份作为训练集,将选取的验证集输入训练后的决策树模型,验证模型指标评分并保存;步骤7:重复步骤6k次,每一次选取的验证集均不相同,得到k个模型指标评分,取k个模型指标评分的平均值即得到决策树模型的最终评分;步骤8:将未知用户类型的手机数据按照步骤1和步骤2进行数据处理,并计算用户出行指标;将出行指标输入到步骤6和步骤7所得到的决策树识别模型中,输出相应用户类型标签;决策树构建的关键在于利用信息增益确定分类结果的“纯度”,设训练数据集为D,|D|表示其样本容量;设有K个类Ck,k=1,2,3,|Ck|为属于类Ck的样本个数;设特征值A有n个不同的取值{a1,a2,...,an},根据特征值A的取值将D划分为n个子集D1,D2,...Dn,|Di|为Di的样本个数;记子集Di中属于类Ck的样本集合为Dik,即Dik=Di∩Ck,|Dik|为Dik的样本个数;则数据集D的信息熵为特征值A对于数据集D的条件熵则特征值A对于数据集D的信息增益gD,A=HD-HD|A;构建决策树,第一步计算样本集合D的信息熵第二步计算出当前属性集合{N,Pg,Pd,Pf,Pw,Pc,Fs}中每个属性的信息增益,比较信息增益的大小,使用信息增益最大的属性进行划分,并得到划分后的数据子集;第三步对每一个数据子集按照“第二步”继续划分,得到最终的决策树。

全文数据:

权利要求:

百度查询: 北京工业大学 一种利用手机数据识别跨城通勤人群的方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。