Document
拖动滑块完成拼图
个人中心

预订订单
服务订单
发布专利 发布成果 人才入驻 发布商标 发布需求

在线咨询

联系我们

龙图腾公众号
首页 专利交易 科技果 科技人才 科技服务 国际服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索
当前位置 : 首页 > 专利喜报 > 恭喜北京工业大学刘希亮获国家专利权

恭喜北京工业大学刘希亮获国家专利权

买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!

龙图腾网恭喜北京工业大学申请的专利一种基于NGBoost算法的PM2.5浓度长时间序列预测方法获国家发明授权专利权,本发明授权专利权由国家知识产权局授予,授权公告号为:CN114611399B

龙图腾网通过国家知识产权局官网在2025-03-18发布的发明授权授权公告中获悉:该发明授权的专利申请号/专利号为:202210268175.5,技术领域涉及:G06F30/27;该发明授权一种基于NGBoost算法的PM2.5浓度长时间序列预测方法是由刘希亮;高雨瑶;赵俊杰;张羽民;李建强;林绍福设计研发完成,并于2022-03-17向国家知识产权局提交的专利申请。

一种基于NGBoost算法的PM2.5浓度长时间序列预测方法在说明书摘要公布了:本发明公开了一种基于NGBoost算法的PM2.5浓度长时间序列预测方法,该方法综合气象和其他污染物影响因素,提出了基于自然梯度提升的PM2.5浓度预测模型,以提升长时间序列PM2.5浓度预测的精度。使用IsolationForest算法对采集到的目标站点空气污染物及气象数据进行了异常值判定、通过斯皮尔曼相关系数进行特征选择等预处理作为总数据集;提出数据时序离散化方法,使用所有天中同一小时的数据构成模型输入。然后进行了数据规范化、数据集划分比例、阈值等参数调优实验进行模型优化。最后将离散化后的多维数据集采用NGBoost算法,得出对目标站点未来一天PM2.5浓度的小时级精确化预测值。本发明为PM2.5浓度长时间序列预测提供了一个开放的研究框架。

本发明授权一种基于NGBoost算法的PM2.5浓度长时间序列预测方法在权利要求书中公布了:1.一种基于NGBoost算法的PM2.5浓度长时间序列预测方法,其特征在于,该方法的实施步骤如下:1获取某地区目标空气监测站点的空气污染物和气象数据,并对数据进行存储和预处理;2对步骤1获得的数据进行时序离散化,提取不同天数中同一小时的特征数据构成特征矩阵;3对数据进行规范化、调整模型数据集划分比例、阈值参数,进行多组对比实验,完成参数调优;4使用NGBoost算法对离散化后的二维特征矩阵进行训练和验证;5输出目标站点未来一天的小时级PM2.5浓度预测结果;所述步骤1中,进行数据预处理包括:1利用IsolationForest算法剔除总数据集中的异常值;首先将空气污染物浓度小于0的数据转换为空值,采用IsolationForest算法,将样本随机切分成若干个树;通过随机采样数据对每棵树进行训练,进而保证每棵树的方差达到运行者要求;最后利用如下公式计算Z中所有样本点的异常值评分矩阵SC,其中SC={sc00,sc01,sc02…scxy},x=12,y=α; 其中E[hzij]为zij在多棵树中路径长度的期望值;cn是包含n个样本数据集的树平均路径长度,用来标准化记录zij的路径长度;H*为调和数,ξ为欧拉常数;随后返回数据集中的异常点,设异常点评分的阈值为ρ,当任意数据点的异常值评分大于阈值,即时,将数据集中的该异常点zij设为空值;得到新的总数据集Z';2计算PM10浓度、NO2浓度、CO浓度、O3浓度、SO2浓度、温度、气压、相对湿度、风向、风速特征序列与PM2.5浓度序列的斯皮尔曼相关性系数,选择与PM2.5相关性强的因素作为输入模型的特征;首先利用如下公式计算任意两个特征fi、fj之间的相关性rij: 其中n表示样本的数量和,α为从0开始的索引最后一行的行数,dk表示两个特征数据集合中数据次序的差值,Z'i和Z'j为分别为数据集Z'中第i个特征和第j个特征对应的数值列;随后设检查PM2.5浓度和其他特征的相关性系数最小阈值为η,其他特征的相关性以及其他特征之间的相关性系数最大阈值为θ;当或时,则删除第j个特征对应的数值列Zj,不作为后续模型的输入数据,其他数据列保持不变;依照以上操作最终得到模型的输入数据集Zinput;3由筛选得到的特征序列构建目标站点的三维数据矩阵;所述步骤2中,进行数据离散化包括:首先分离训练集和测试集数据;从预处理后的输入数据集Zinput中选取目标监测站点第1天至第d天的所有数据作为训练集,第d+1天至第N天的所有数据作为测试集,其中随后时序离散化训练集数据;首先将训练集中数据,按照时间顺序排列;按照时刻分组,取出训练集中不同天数同一时刻的特征数据并将利用其组成24个二维数据矩阵;设第i小时的数据mi∈MT×F,其中T代表了训练集包含的天数且T≤d,L代表了预处理后剩余的特征数量;由此得到三维数据矩阵MH×T×F,其中H=24代表了一天中的24小时;随后取出PM2.5浓度对应的数据设为YH×T作为模型的标签,设第i天第j小时的标签数据yij∈YH×T;随后将剩余的数据矩阵M'H×T×F-1设为即将入模的三维特征矩阵;所述步骤3中,进行参数调优包括:1数据规范化;为了消除不同特征变量见量纲的相互影响,对数据进行规范化处理;设映射区间为[a,1],m'ijk∈MH×T×F,利用如下公式进行数据最大-最小规范化: 设置a分别等于-1、0进行实验,通过比对实验结果得到能使模型表现最佳的映射区间;2数据集划分比例选择;设定训练集和测试集的比例为6:4、7:3、8:2、9:1进行对比实验,通过实验结果选出最优的划分比例;3阈值大小选择;选择不同的阈值来降低模型预测的不准确性,设阈值范围为[0.75,0.9],以0.01的步长遍历搜索,通过实验结果找到能使模型表现最优的阈值;4以上1—3的对比实验中,每一次调整模型参数时,均在数据集中进行十次随机采样;利用采样后的十组数据,在相同模型参数的条件下训练模型;十次训练得到的预测性能值取平均作为该模型参数的最终预测性能。

如需购买、转让、实施、许可或投资类似专利技术,可联系本专利的申请人或专利权人北京工业大学,其通讯地址为:100124 北京市朝阳区平乐园100号;或者联系龙图腾网官方客服,联系龙图腾网可拨打电话0551-65771310或微信搜索“龙图腾网”。

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。