买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:北京工商大学;中煤科工集团沈阳研究院有限公司
摘要:本发明提供一种基于多变量多步LSTM模型的气体浓度预测方法,属于环境气体检测领域。该方法包括:1对多种气体浓度及温度的时间序列数据做预处理及关联分析,选择指标气体;2利用指标气体浓度及温度时序数据构建滑动窗口数据集;3构建多变量多步LSTM模型;4训练模型;5用验证集验证评估模型;6用测试集测试模型,选择最优模型参数;7用构建的模型对现场气体浓度进行预测。本发明基于多变量多步LSTM模型的实现了多种气体浓度的同时预测,为环境气体监测提供了一套完整、高效、可行的解决方案,具有较高的应用价值及推广价值。
主权项:1.一种基于多变量多步LSTM模型的气体浓度预测方法,其步骤包括:A.对输入的多种气体浓度及温度的时间序列数据做预处理,选择关键的指标气体CO、C2H4、C3H6、C2H2、CH4、C2H4、C2H6、C3H8、C2H6;具体如下:A1.将输入的多种气体浓度及温度的时间序列数据做归一化处理;A2.分析不同气体浓度与温度之间以及不同气体浓度两两之间的关联关系;A3.综合步骤A2的结果,选择相关性最大的K种气体以及温度做气体浓度预测;B.利用所选取的K种指标气体浓度及温度时间序列数据构建滑动窗口数据集,C.构建多变量多步LSTM模型,具体步骤如下:C1.构建LSTM1,单元状态记为Ct1,隐藏状态记为Ht1;C2.构建LSTM2,将Ct1和Ht1传输给LSTM2,LSTM2的单元状态记为Ct2,隐藏状态记为Ht2;C3.重复以上操作,将K+1个LSTM单元并联成为多变量多步LSTM模型,记为mLSTM,mLSTM={LSTMj},1=j=K+1;D.训练多变量多步LSTM模型,具体步骤如下:D1.设定训练的超参数,包括模型初始化的随机种子数seed、学习率lr、模型训练总轮数epoch,一个训练批次的样本个数batch_size;D2.根据设定的随机种子数seed初始化mLSTM状态种子;D3.获取训练集O,记为O={oji},1=i=No,1=j=K+1;D4.用batch_size个样本作为一批数据训练模型,1=batch_size=No,具体步骤如下:D4.1把第j列的样本集Oj当中的batch_size个样本{oji}作为一批数据,1=j=K+1,1=i=batch_size;D4.2把该批数据中的每个样本oji=Dxi,Dyij中的Dxi作为LSTMj的输入,得到预测输出yj,1=i=batch_size;D4.3用该批数据中的每个样本oji=Dxi,Dyij中的Dyj作为LSTMj的期望输出,用期望输出Dyj和预测输出yj计算每个样本的损失loss;D4.4用该批数据所有样本的损失loss,计算批数据损失mloss;D4.5用批数据损失mloss计算梯度,用梯度和学习率lr更新模型的参数;D5.用全部训练集中的后续批次数据,按照步骤D4方式迭代训练并更新模型的参数,直到批数据损失mloss收敛达到预设标准,作为一轮训练;D6.按照epoch的设置重复训练epoch轮,判断批数据损失mloss是否达到预设标准;D7.如批数据损失mloss未达到预设标准,则调整参数lr、epoch以及batch_size,按照步骤D3到D6所述方式迭代训练模型;如已达到指定标准,则结束训练,导出训练好的模型的参数;E.用验证集对训练好的模型进行验证评估,具体步骤如下:E1.获取验证集P,记为P={pji},1=i=Np,1=j=K+1;E2.把验证集中所有样本输入模型,得到模型的预测结果,具体步骤如下:E2.1把第j列的样本集Pj当中的每个样本pji=Dxi,Dyij中的Dxi作为LSTMj的输入,得到预测输出yj,1=i=Np;E2.2把K+1个LSTM单元的期望输出的集合,记为mLSTM的期望输出;把K+1个LSTM单元的预测输出的集合,记为mLSTM的预测输出;E3.使用mLSTM的期望输出和预测输出,计算均方误差RMSE和平均绝对误差MAE;E4.用RMSE和MAE对模型进行评估,值越小,表示模型的准确率越高;E5.若准确率没有达到预设标准,则重复D所述步骤,调整滑动窗口数据集的长度L和步长S、一个训练批次的样本个数batch_size、模型训练总轮数epoch和学习率lr,重新训练模型;F.用测试集测试多变量多步LSTM模型,调整并选择最优模型参数,具体步骤如下:F1.用步骤E所述方式,用测试集代替验证集,把数据输入模型预测气体浓度,并判断是否达到RMSE的预设标准;F2.若准确率没有达到预设标准,则重复D所述步骤,调整滑动窗口数据集的长度L和步长S、一个训练批次的样本个数batch_size、模型训练总轮数epoch和学习率lr,重新训练模型;F3.如果达到预设标准,将预测效果最优的模型导出,作为最终模型;将最优的滑动窗口数据集长度记为L0,步长记为S0;G.用构建的模型对现场气体浓度进行预测,其中No表示训练集O的样本个数;Np为验证集P的样本个数。
全文数据:
权利要求:
百度查询: 北京工商大学 中煤科工集团沈阳研究院有限公司 一种基于多变量多步LSTM模型的气体浓度预测方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。