首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

【发明授权】一种基于随机森林与气象数据的云预测方法_南京大学_202410257949.3 

申请/专利权人:南京大学

申请日:2024-03-07

公开(公告)日:2024-06-21

公开(公告)号:CN117851927B

主分类号:G06F18/243

分类号:G06F18/243;G06F18/214;G06N3/0464;G06N3/09

优先权:

专利状态码:有效-授权

法律状态:2024.06.21#授权;2024.04.26#实质审查的生效;2024.04.09#公开

摘要:本发明提供了一种基于随机森林与气象数据的云预测方法,该方法以气象数据为数据集进行模型训练,在多维的数据集选取方案与模型优化方法的作用下,可以实现高精度与高准确率的有云、无云预测。气象数据集包括地表、高空数据在内的多个水平面内数据,可以避免云层影响因素的遗漏;由于随机森林在处理数据噪声、进行分类任务方面的优越表现,模型训练成本较低,所需时间短;系统的预测结果通过多参数进行评估,有助于系统的多场景、高效率利用。

主权项:1.一种基于随机森林与气象数据的云预测方法,其特征在于包括以下步骤:步骤S1,数据筛选:建立随机森林模型,以数值预报系统作为气象因子数据库,并根据气象学中各气象因子对预覆盖率的影响大小,对气象因子进行筛选,并作为本预测方法的输入数据;步骤S2,模型训练:将步骤S1筛选得到的数据按训练集:测试集:验证集=7:2:1的比例进行划分,并通过训练集的数据对随机森林模型进行训练,得到训练优化后的模型;步骤S3,结果评估:该步骤通过将有云无云的预测结果,与实际的有云无云进行对比,有云即为1,无云即为0;通过召回得分、精确度、F1调和平均值、偏差四个参数进行评估,所述四个参数由下面公式给出: ,所述分别依次对应实际有云预测有云、实际有云预测无云、实际无云预测有云、实际无云预测无云四种结果;步骤S2所述模型训练的过程依次包括基线拟合、主成分分析和超参数优化三个步骤,具体过程如下:(1)基线拟合:通过权重计算函数,计算得到不同气象因子的的基尼指数并进行排序;所述基尼指数反映不同气象因子对云覆盖率的影响大小,基尼指数大的气象因子,在后续的预测过程中,将相应地被赋予更高的权重;(2)主成分分析:在上述基线拟合的基础上,通过下式确定在保证拟合效果达到预设阈值的前提下,所需的最少气象因子数量n, ,式中,为气象因子总量,为表示第i个气象因子,且按照基线拟合中结果从到排序,为累计方差比函数,函数值越大,则拟合效果越好;(3)超参数优化:首先,在主成分分析确定影响气象因子后,对随机森林模型的超参数进行优化调整设置;所述超参数包括“决策树的数量”、“决策树的最大深度”、“拆分的最大特征数”、“拆分内部节点所需的最小样本数”、“叶子节点包含的最少样本数量”、“是否随机放回抽样”,分别用n_estimators,max_depth,max_feature,min_samples_split,min_samples_leaf,bootstrap表示;然后,采用随机搜索的方法,从预先设置的超参数采样数值中随机选取不同的组合,在达到预先设定的采样次数后,比较不同组合所构成模型的预测结果并进行排名,得到局部最优的超参数组合;最后,通过网络搜索的方法,在得分高的超参数组合中,选取步长更小的超参数数值;并以此遍历所有的超参数组合,再进行预测结果排名,确定预测准确率最高的模型;步骤S1中所述气象因子的筛选是在选定的经纬度网格范围内,以气压高低为划分标准,从六个高度平面进行选取,分别为第1层的地表气象因子和第2-6层的高空气象因子;所述高空气象因子,在300~730hPa气压范围内;所述地表气象包括温度、湿度、气压、U分量风和V分量风;所述高空气象包括可降水量、露点温度、露点下降、相对湿度、反演云顶高度。

全文数据:

权利要求:

百度查询: 南京大学 一种基于随机森林与气象数据的云预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。