首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

基于大数据的城市资源配置和产业特色分析方法及系统 

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

申请/专利权人:江西省科技事务中心

摘要:本发明公开了基于大数据的城市资源配置和产业特色分析方法及系统,通过获取城市大数据,将大数据构建成一个数据集并存储;将数据集进行数据预处理,利用主成分分析方法降低数据集维度,从数据集中提取特征数据;基于提取的特征数据,通过K均值聚类算法对特征数据进行分析,建立决策树模型,得到城市产业特色和资源配置的特点;基于特征数据,通过线性回归分析方法分析城市产业特色和资源配置之间的内在联系;通过地理信息系统将城市资源配置和产业特色进行可视化呈现。本发明通过对大数据的收集和特征提取,并将所提取的数据通过大数据算法对城市资源配置和产业特色进行分析,基于分析结果为政府部门和企业提供决策支持。

主权项:1.基于大数据的城市资源配置和产业特色分析方法,其步骤为:S01、通过API接口、网络爬虫技术获取城市企业、人口、地理环境、自然资源大数据,将大数据构建成一个数据集,根据数据集的特点、规模、访问需求,选择关系型数据库、非关系型数据库、文件系统中的一种作为数据存储方式;S02、将数据集进行数据预处理,去除重复、异常的数据,根据研究目标和分析问题,利用主成分分析方法降低数据集维度,从数据集中提取主成分,主成分为反映出城市产业特色和资源配置的特征数据;主成分分析方法的步骤为:计算数据集中各个特征之间的协方差矩阵;对协方差矩阵进行特征值分解,得到特征值和对应的特征向量,特征向量代表了原始变量空间中的新坐标系方向,而特征值则表示了数据在这些方向上的方差大小;根据特征值的大小,选择最大的W个特征值对应的特征向量作为主成分,通过累积贡献率来确定保留的主成分数量;将数据集投影到选定的主成分上,得到降维后的数据表示,以利用主成分来代表数据集的特征,即特征数据;S03、基于步骤S02中提取的特征数据,通过K均值聚类算法对特征数据进行分析,建立决策树模型,通过决策树模型分析得到城市产业特色和资源配置的特点;将降维后的特征数据输入K均值聚类算法进行分析,将每个特征数据分配到对应的某个簇中,将这个簇赋予一个表示所属城市的标签,然后绘制类误差平方和的曲线图,找到肘部对应的聚类数目作为最佳的聚类数目;确定最佳聚类数目后,计算出每个簇的中心,得到所属城市中不同区域的聚类簇;使用带有簇标签的特征数据作为训练集,将所属城市的产业特色和资源配置作为目标变量,训练决策树模型;对训练好的决策树模型进行评估,检查其对城市产业特色和资源配置的预测性能,使用训练好的决策树模型,对新的城市特征数据进行预测,分析该城市内不同区域的产业特色,通过该城市的不同簇之间的特征分布,得出该城市内不同区域的资源配置的特点;S04、基于步骤S02中提取的特征数据,通过线性回归分析方法分析城市产业特色和资源配置之间的内在联系,通过线性回归分析方法,衡量资源配置对产业特色的影响程度;S05、通过地理信息系统将城市资源配置和产业特色进行可视化呈现;通过地理信息系统将线性回归结果以图形方式展示出来,量化资源因素对产业发展的贡献度。

全文数据:

权利要求:

百度查询: 江西省科技事务中心 基于大数据的城市资源配置和产业特色分析方法及系统

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。