首页 专利交易 科技果 科技人才 科技服务 商标交易 会员权益 IP管家助手 需求市场 关于龙图腾
 /  免费注册
到顶部 到底部
清空 搜索

一种基于交叉注意力神经网络的交通态势预测方法 

申请/专利权人:南京工业大学

申请日:2024-03-18

公开(公告)日:2024-06-21

公开(公告)号:CN118228105A

主分类号:G06F18/241

分类号:G06F18/241;G08G1/01;G06F18/214;G06N3/042;G06N3/045;G06N3/0464;G06N3/084;G06F17/16;G06N3/0442

优先权:

专利状态码:在审-公开

法律状态:2024.06.21#公开

摘要:本发明涉及一种基于交叉注意力神经网络的交通态势预测方法。该方法通过引入时空交叉注意力STCANN模块,结合流量和速度时空块和交叉注意力机制,来捕捉交通流量数据中的时空关系和特征。STCANN模块由堆叠的时空交叉注意力模块和分类预测层组成,其中,每个堆叠的时空交叉注意模块由空间交叉注意力块和时间交叉注意块组成,可以用于细致地提取路网中的时空特征,并通过堆叠的模块来实现更深层次的学习。分类预测层由两个卷积层组成,结合最后一个交叉注意力模块的时空特征实现多步预测,并且最后的输出是分类的道路服务水平。该方法在交通态势预测任务中展现了独特性、创新性和优越性。

主权项:1.一种基于交叉注意力神经网络的交通态势预测方法,步骤包括:首先构建预测模型;然后以采集到的交通状态数据作为预测模型的输入,预测模型的输出为分类的道路服务水平;其特征是交通流量数据是交通态势中的速度和流量;所述预测模型是基于交叉注意力神经网络模型;预测方法的步骤包括:步骤1.明确交通态势预测的数据形式和问题定义首先,将交通路网定义为无向图G=Ψ,E,A,其中Ψ为检测器节点集,|Ψ|=N为检测器的节点数,E为反应检测器间物理连通性的边集,A为邻接矩阵;设交通路网G中的每个检测器以相同的采样频率检测f个交通数据,每个节点在每个时间片生成一个长度为f的特征向量;形式上,用表示节点i在时刻t的维数c∈流量,速度中的特征,表示节点i在时刻t的所有维数的特征,表示时刻t在所有维度上所有节点的特征集;接下来,给定一个空间路网数据G,从历史观测值Xflow=Xflow,1,Xflow,2,...,Xflow,τT∈RN×f×\tau和Xspeed=Xspeed,1,Xspeed,2,...,Xspeed,τT∈RN×f×\tau来预测未来时刻的道路服务水平Xflow表示流量,Xspeed表示速度;τ表示过去的总时间;N表示检测器的节点数、TP表示预测未来TP时刻的道路服务水平;将步骤1得到的当前时刻的Xflow和Xspeed输入堆叠的时空交叉注意力模块中;堆叠的时空交叉注意力模块是由多个时空交叉注意力模块堆叠组成;步骤2.一个时空交叉注意力模块包括空间交叉注意块和时间交叉注意块;对于第i个时空交叉注意力模块:首先,流量空间输入与速度空间输入分别输入到空间交叉注意块中;上标S表示是空间注意力块,下标flow表示流量,下标speed表示速度,下标i表示第i个时空交叉注意力模块,上标dG表示维度特征,上标N表示节点数,上标M表示时间长度;空间交叉注意力块结合邻接矩阵A,从输入中分别提取出二者的空间特征和如下式所示: 步骤3.把步骤2生成的分别和相结合,生成用于时间交叉注意力块输入的流量时间特征和流量时间特征上标T表示是空间注意力块,下标flow表示流量,下标speed表示速度,下标i表示第i个时空交叉注意力模块;如下式所示: 步骤4.将经过第i个时空交叉注意力模块处理后的第i个输出传入到第i+1个时空交叉注意力模块中,如下式所示: 以此类推,经过堆叠的时空交叉注意力模块处理得到流量时空特征和速度时空特征和上标ST表示是时空交叉注意力模块,下标flow表示流量,下标speed表示速度;步骤5.采用分类模块将和融合在一起后,再通过迭代学习得到最终的分类结果;步骤2中,所述空间交叉注意力块的结构包括以下五个部分:模块1:位置嵌入层Spatialembeddinglayer在空间交叉注意力块中,将不同维度特征向量的“位置”信息注入到输入序列中,具体来说:首先,时空的嵌入矩阵分别用字典DSflow,speed∈RN×N和DTflow,speed∈RM×M表示,分别用图邻矩阵和单热时间编码来初始化字;上标S表示空间嵌入,上标T表示时间嵌入,上标N表示节点数,上标M表示时间长度;然后,在训练期间更新字典;随后,将DSflow,speed和DTflow,speed沿时空维度进行扩展,得到DSflow,speed∈RM×N×N,DTflow,speed∈RM×N×M;最终,编码特征是和其中Ft为1×1的卷积层;模块2:固定的图卷积层GraphConvolutionLayer根据学习到的权值和预定义的图,通过聚合邻接信息来学习节点特征,从而有效地学习到结构感知的节点特征,具体为:使用基于切比雪夫多项式近似的图卷积来捕获先验道路拓扑的固定空间依赖性;A表示邻接矩阵,X表示检测器实时交通状况的输入节点特征,Tk是k阶切比雪夫多项式,D表示度矩阵,L=In-D-12AD-12表示归一化拉普拉斯矩阵,是切比雪夫多项式的缩放拉普拉斯矩阵,λmax是L的最大特征值;用k阶的切比雪夫多项式逼近图卷积,得到结构感知的节点特征: 其中,是节点特性的第i个通道,θij,k表示可学习的参数;模块3:空间交叉注意力层采用交叉注意机制来计算和学习多重潜在高维子空间中维度特征的相互依赖性;在该层中,每个时间步的不同维度嵌入特征和通过前馈神经网络被投射到高维潜在子空间中;每个节点训练的三个潜在子空间分别包括,查询子空间和键子空间和以及值子空间和表示是空间上的维度特征,下标f表示流量,下标s表示速度,上标N表示节点数;它们的计算公式分别为: 其中,和和和分别表示权重矩阵;对不同特征的高维子空间进行交叉计算,流量与速度之间的交叉具体过程为:过程1:通过归一化操作分别计算出流量特征Xflow和速度特征Xspeed对动态空间的依赖性,分别用和表示, 过程2:将速度关键子空间与特征映射高维子空间后的查询子空间做动态空间依赖计算;对于速度对流量的依赖性,将速度投射在高维子空间的查询子空间与流量的关键子空间做动态交叉计算,分别形成和 过程3:将流量值子空间速度值子空间VsS分别与表示节点之间的动态矩阵和表示流量和速度交叉关系的动态依赖矩阵进行运算,生成新节点下的流量和速度特征: 模块四:前馈神经网络Feedforwardnetwork在不同的特征节点上应用具有非线性激活函数的前馈神经网络,并将节点特征更新为: 其中,为权重矩阵,为残差连接;将获得的数据与原始数据一起传递到具有非线性激活函数的前馈神经网络中以进一步提高节点的预测能力: 其中,为权重矩阵,为残差连接;模块五:门控机制Gate采用门控机制融合模块之间的空间关系;首先,学习门g:g=sigmoidfSΦS+fGXG+b其中,fs和fG为全连接层,b为偏置项;最终,空间变压器SpatialTransformerNetworks,STN的输出为YS=gUS+1-gXG在时间交叉注意力模块中,输入分别为和其中Gt是一个1×1的卷积层,在该层中,每个节点训练的三个潜在子空间分别包括查询子空间和键子空间和以及值子空间和表示是时间上的维度特征,下标f表示流量,下标s表示速度,上标M表示时间长度;以下是它们的计算公式: 其中,和和和分别表示权重矩阵;所述步骤3中,流量与速度之间的交叉的步骤包括:过程1:通过归一化操作分别计算出流量特征Xflow和速度特征Xspeed对时间的依赖性,分别用和表示: 过程2:将速度关键子空间与特征映射高维子空间后的查询子空间做动态空间依赖计算;同时对于速度对流量的依赖性,将速度投射在高维子空间的查询子空间与流量的关键子空间做动态交叉计算,分别形成和 过程3:将流量值子空间速度值子空间Vsτ分别与表示节点之间的动态矩阵和表示流量和速度交叉关系的动态依赖矩阵进行运算,生成新节点下的流量和速度特征 所述步骤5中,首先,堆叠的时空交叉注意力模块的输出在分类模块内的堆叠层StackLayers堆叠融合,长度增加形成一个新的张量DLOS,表示为随后,张量DLOS通过多个卷积层ConvolutionLayer进行降维并扩展类别,从而得到一个变换后的张量表示为最后,通过对输入到交叉熵层CrossentropyLayer的已知标签张量进行持续训练和学习,获得最终的预测结果;采用平均绝对损失函数对预测模型进行训练,表示为L=∥Y-Ygt∥1。

全文数据:

权利要求:

百度查询: 南京工业大学 一种基于交叉注意力神经网络的交通态势预测方法

免责声明
1、本报告根据公开、合法渠道获得相关数据和信息,力求客观、公正,但并不保证数据的最终完整性和准确性。
2、报告中的分析和结论仅反映本公司于发布本报告当日的职业理解,仅供参考使用,不能作为本公司承担任何法律责任的依据或者凭证。