买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京交通大学
摘要:本发明提供一种跨城市兴趣点分布数据迁移预测方法及系统,属于目标识别技术领域,获取城市POI分布数据;对获取的城市POI分布数据进行网格化处理,将各POI维度数量作为网格的特征,形成城市网格化POI数据集,即城市的特征矩阵;基于城市网格化POI数据集,使用K‑means聚类方法进行聚类,得到城市POI分布聚类结果;基于城市POI分布聚类结果,选择与目标城市同类别下的城市作为源城市,利用预先训练好的迁移预测模型进行迁移学习预测,得到目标城市的兴趣点分布结果。本发明使用城市聚类,从相似度判别角度,即从源头上解决问题,配合基于样本的迁移技术,获得了更准确的预测结果。
主权项:1.一种跨城市兴趣点分布数据迁移预测方法,其特征在于,包括:获取城市POI分布数据;对获取的城市POI分布数据进行网格化处理,将各POI维度数量作为网格的特征,形成城市网格化POI数据集,即城市的特征矩阵;基于城市网格化POI数据集,使用K-means聚类方法进行聚类,得到城市POI分布聚类结果;基于城市POI分布聚类结果,选择与目标城市同类别下的城市作为源城市,利用预先训练好的迁移预测模型进行迁移学习预测,得到目标城市的兴趣点分布结果,所述迁移预测模型是对TrAdaBoost模型进行改进,得到的Two-stepTrAdaBoost-Multi模型;所述迁移预测模型进行训练时,使用目标城市POI数据进行训练,并使用对源城市POI数据进行预测,得到源城市POI数据预测结果;设定一个阈值,根据源城市POI数据预测结果,选择样本加权残差小于设定阈值的子集作为最终源城市数据集,再进行TrAdaBoost算法过程;调整TrAdaBoost模型中的基学习器支持向量机模型SVM,改用CART决策树模型作为基学习器,并对CART决策树模型内部输出进行调整,添加softmax层使其支持多分类,用于解决大量样本与多分类问题;TrAdaBoost算法步骤如下:若源域和目标域数据的数量分别为a和b,则在数据权重初始化时,往往会将权重设置为: 同时还要设置一个参数值θ,将其用于权重更新,若基学习器的个数为E,则其公式为: 在训练得到一个基学习器后,计算该基学习器在目标域上的错误率: 通过该错误率进一步更新θ的值: 设置的θ值则将用于权重的更新: 其中θ为小于1的正值;在若干次迭代后,源域数据将会根据与目标域数据的相似程度,对目标数据的帮助程度获得权重,实现正向迁移效果;所述迁移预测模型训练使用的损失函数为: 其中,表示目标城市数据的数量,表示目标城市第i组数据的预测值,表示目标城市第i组数据的真实值,表示数据样本的权重。
全文数据:
权利要求:
百度查询: 北京交通大学 跨城市兴趣点分布数据迁移预测方法及系统
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。