买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:深圳市展群信息技术有限公司
摘要:本发明公开了一种基于数据中台的企业数据分析方法、系统及介质,本发明通过物流数据中台采集预设地区的物流大数据,利用地图模型划分物流区域,并基于路线频次、长度、货物流量和类型分析各区域特征。构建决策树分类模型对物流区域分类,并形成区域组。通过Apriori算法对相同重要度的物流数据集进行关联性分析,得到关联数据集。最终,标准化数据并存储于物流数据中台,提高数据复用性和关联性数据提取的精准高效性,实现有效的数据挖掘与数据优化存储。
主权项:1.一种基于数据中台的企业数据分析方法,其特征在于,包括:在一个预设时间段内,通过物流数据中台采集预设地区的物流大数据,通过物流大数据获取物流路线信息与物流订单数据;通过地图模型,将预设地区进行区域性划分,划分基于各个物流点,形成多个物流区域,基于物流路线信息与物流订单数据进行区域性分析,分析维度基于路线频次、路线长度、货物流量、货物类型,并得到各个物流区域的区域特征数据;构建基于决策树的分类模型,基于历史区域特征数据对分类模型进行训练学习,将所述各个物流区域的区域特征数据导入分类模型进行区域分类,基于分类结果形成多个区域组;对每个区域组中的物流区域进行基于路线的重要度分析,生成区域重要度排序表,将物流大数据基于多个区域组进行数据划分,形成多个物流数据集,基于区域重要度排序表,对相同重要度的物流数据集进行数据整合并基于Apriori算法进行关联性分析,得到关联数据集;将物流数据集、关联数据集与区域重要度排序表进行数据标准化并存储于物流数据中台;其中,所述通过地图模型,将预设地区进行区域性划分,划分基于各个物流点,形成多个物流区域,基于物流路线信息与物流订单数据进行区域性分析,分析维度基于路线频次、路线长度、货物流量、货物类型,并得到各个物流区域的区域特征数据,具体为:基于预设地区的面积、轮廓构建可视化二维地图模型;将预设地区的物流点导入地图模型,基于物流点,对预设区域进行区域性划分,得到多个物流区域,每个物流区域包括一个物流点;通过物流路线信息与物流订单数据,对每个物流区域进行路线数据分析与统计,分析维度包括路线频次、路线长度、货物流量、货物类型,并得到物流区域的路线特征数据与物流货物特征数据;将路线特征数据与物流货物特征数据整合为区域特征数据;其中,所述构建基于决策树的分类模型,基于历史区域特征数据对分类模型进行训练学习,将所述各个物流区域的区域特征数据导入分类模型进行区域分类,基于分类结果形成多个区域组,具体为:构建基于决策树的分类模型;采集预设地区的历史区域特征数据,并得到历史区域特征数据,基于预设聚类模型对历史区域特征数据进行数据聚类并筛选出高相似数据,并将高相似数据标记为分类特征数据;以分类特征数据作为根节点与子节点的判断特征信息,采用预设启发式算法,首先确定根节点,并进一步生成内部子节点与叶子节点,形成基于完整决策树的分类模型;以历史区域特征数据作为训练数据导入分类模型进行分类训练与模型优化,并得到训练后的分类模型;将所述各个物流区域的区域特征数据导入分类模型进行区域分类,基于分类结果,将相同类型的物流区域进行整合形成区域组,基于所有物流区域最终得到多个区域组;其中,所述对每个区域组中的物流区域进行基于路线的重要度分析,生成区域重要度排序表,将物流大数据基于多个区域组进行数据划分,形成多个物流数据集,基于区域重要度排序表,对相同重要度的物流数据集进行数据整合并基于Apriori算法进行关联性分析,得到关联数据集,具体为:选取一个区域组作为当前区域组,将当前区域组内所有物流区域的物流路线信息与物流订单数据进行路线重要度计算分析,所述路线重要度计算分析基于路线频次、路线长度、货物流量进行计算,并得到每个物流区域的路线重要度,路线重要度正比于路线频次、路线长度、货物流量,计算出每个物流区域的路线重要度;当前区域组的路线重要度等于组内所有物流区域的路线重要度的均值;对所有区域组进行路线重要度计算,并基于计算结果生成区域重要度排序表;将物流大数据基于多个区域组进行数据划分,形成多个物流数据集;基于区域重要度排序表,将相同路线重要度的区域组所对应的物流数据集进行整合,形成融合数据集;基于Apriori算法,设定最小支持度阈值与最小置信度阈值,扫描融合数据集,生成频繁项集,基于最小支持度阈值,从频繁项集去除不符合要求的数据单项,得到处理后的频繁项集;基于频繁项集,生成所有可能的关联规则并计算其置信度,基于关联规则的置信度与最小置信度阈值,对关联规则进行筛选并形成强关联规则;将频繁项集与强关联规则作为关联数据集;其中,还包括:在下一个预设时间段内,基于数据终端采集各个物流区域的物流路线信息与物流订单数据并将数据整合为第二物流数据;基于所述物流路线信息与物流订单数据进行物流区域特征分析并基于分类模型进行特征分类,通过对二次分类结果与上一个预设时间段内的分类结果进行差异对比,若结果差异大于预期差异,则基于二次分类结果重新划定区域组;基于二次划定的区域组进行基于路线的重要度分析与基于Apriori算法进行关联性分析,生成二次关联数据集;通过物流数据中台,基于二次关联数据集对原始关联数据集进行更新。
全文数据:
权利要求:
百度查询: 深圳市展群信息技术有限公司 一种基于数据中台的企业数据分析方法、系统及介质
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。