买专利卖专利找龙图腾,真高效! 查专利查商标用IPTOP,全免费!专利年费监控用IP管家,真方便!
申请/专利权人:西南交通大学
摘要:本发明公开了一种基于非监督学习的空气质量推断方法,具体为:首先将区域栅格化,再获取空气质量数据、气象数据、交通数据和地理数据;建立空气质量推断模型,非监督学习任务致力于特征提取,而监督学习任务则负责执行核心的推断过程,模型包含类别型特征编码、位置编码模块、空间插值模块、特征编码模块和特征解码模块;将基于梯度的正则化纳入损失函数中;基于梯度计算特征重要性,完成空气质量推断。本发明提出了适用于类别型特征方法,提升了模型的预测准确性,进一步提升了模型的推断能力和可解释性。
主权项:1.一种基于非监督学习的空气质量推断方法,其特征在于,包括以下步骤:步骤1:研究数据的获取与预处理;1区域栅格化:为了获得细粒度的空气质量数据,将研究区域划分为500m*500m的正方形网格;2空气质量数据:通过标准站和微站的传感器,获取每小时污染物的浓度数据,将标准站数据作为标签;对于微站的数据,采用局部加权回归和季节性趋势分解STL进行分析;STL将时间序列数据分解为趋势、季节性和残差三个组成部分,选择微站的趋势数据作为预测模型的特征;3气象数据:从气象站的传感器中收集七类关键气象数据,以此作为分析污染物浓度的特征变量,这些气象数据包括边界层高度、气温、相对湿度、气压、风速、风向以及太阳辐射强度;4交通数据:基于运渣车传感器收集的数据以及高德拥堵指数,设计三种与交通相关的特征用于空气质量推断:由运渣车运行模式得出的邻接矩阵AOD,基于道路拥堵数据的网格拥堵指数XCI以及运渣车土方量XVO;邻接矩阵AOD的定义为:如果同一运渣车的连续轨迹点从某个网格ri转移到其邻居网格rj,则这两个网格被认为是邻接的,Ai,j=1,否则,Ai,j=0;网格拥堵指数XCI的定义为: 其中,为时间戳t时网格ri的拥堵指数,ct,j为同一时间路段j的拥堵指数,lj,i为网格ri内路段j的长度;运渣车土方量XVO的定义为:在指定时间窗口内,网格内运渣车的数量;5地理数据:基于从Openstreetmap和高德获得的地理数据,设计两种相关的特征:区域使用和功能特征XGE和语义邻接矩阵ASE;区域使用和功能特征XGE:由兴趣点特征XPOI、土地利用特征XLU和道路长度特征XRL三部分组成;语义邻接矩阵ASE:基于XGE,使用K-maens对网格进行聚类,因此ASE被定义为: 步骤2:建立空气质量推断模型;将空气质量推断任务划分为两个子任务:监督学习和非监督学习任务;在此框架中,非监督学习任务致力于特征提取,而监督学习任务则负责执行核心的推断过程,该模型包含5个核心模块:1类别型特征编码:与连续性特征不同,类别型特征的数值表示的不是一个具体的值,所以在其正式输入模型之前要先进行映射;2位置编码模块:考虑到污染物浓度与空间位置之间的相关性,采用位置编码来增强模型的空间感知能力;位置编码由两部分组成,即行编码RE和列编码CE; 其中pos为位置,dp为维度;3空间插值模块:将自监督学习任务构建为一个与监督学习任务相呼应的回归推断任务;具体来说,利用逆距离加权IDW来空间插值污染物浓度,并将插值结果作为自监督学习任务的标签,IDW的计算公式为: 其中,Xg为网格rg的插值结果,dgc为网格rg与rc之间的大圆距离,k为常数;网格ri的经度φi和纬度λi用弧度表示;4特征编码模块:由一个基于双向长短时记忆神经网络的时间块和两个基于图注意力神经网络的空间块组成;在特征编码器模块中,监督学习任务和自监督学习任务共享参数;5特征解码模块:对于监督学习任务,采用基于图注意力机制的空间块,而对于自监督学习任务,采用全连接神经网络层;步骤3:设计损失函数;为了实现连续型和类别型特征选择,将基于梯度的正则化纳入损失函数中;损失函数为: 其中,θ*,Θ*,为模型学习的参数;asup和αss为监督学习和自监督学习任务的损失权重,影响它们在训练过程中产生的作用;β和γ是特征选择的正则化系数;U和V分别为连续型和类别型特征的个数;kj是对应于第j个类别型特征的嵌入维度;是量化训练数据集Ytrain中真实值yn和推断值之间差异的函数;步骤4:基于梯度计算特征重要性,完成空气质量推断;梯度指导神经网络中的权重更新,一个特征的梯度值越大,表明其重要性越高;考虑到类别型特征在输入特征编码模块之前需要进行编码,设计不同的方法来确定连续特征和类别特征的重要性,公式如下: 其中,和分别为第i个连续型特征和第j个类别型特征的重要性。
全文数据:
权利要求:
百度查询: 西南交通大学 一种基于非监督学习的空气质量推断方法
免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。