一种基于动态时空相似金字塔网络的交通流预测方法
- 国知局
- 2024-07-31 20:59:29
本发明涉及信息技术、交通流量预测等,尤其是一种基于动态时空相似金字塔网络的交通流预测方法。
背景技术:
1、交通数据预测是时空数据挖掘的一项基本任务,也是智慧交通系统的重要组成部分。准确的交通预测可以帮助交通管理部门制定更有效的交通调度和控制策略。通过预测未来的交通流量,智慧交通系统可以优化信号配时、调整车道规划等,从而减少交通拥堵并提高交通流动性。交通流量预测是指通过分析历史交通数据和其他相关信息,对特定路段的交通流量情况进行预测,这需要对时空相关性进行深入建模。
2、早期研究人员应用经典统计学模型来预测未来的交通状况,它们受到数据线性和平滑性假设的限制。基于机器学习的方法可以捕捉交通流数据中的非线性模式和相互作用,但它难以处理交通流的时间相关性和动态变化特征,并且在处理大规模数据和高维特征时可能面临挑战。基于循环神经网络(rnn)的深度学习方法不受这些限制,因此被广泛用于提取时间序列中的长期和短期依赖性。然而,它们无法对交通网络中的空间相关性进行建模。为此,后续的相关研究引入了基于cnn的方法来捕捉空间相关性,但该方法将路网划分为规则的网格结构,无法反应交通路网的不规则图结构,难以提取交通节点之间的复杂空间相关性。随着图深度学习的发展,图卷积网络gcn及其变体亦被广泛应用于时空数据预测任务。此类方法通常以交通网络中部署的传感器为节点,以道路网络或节点之间的距离为边构建交通图,通过节点间的信息传递来更新节点特征。然而,现有的图卷积网络大多使用局部邻域信息进行消息传递,这种局部信息的限制可能导致模型对全局结构的感知能力不足。在时间维度上,不同时期的流量模式差异很大。例如,交通拥堵往往发生在特定时间,根据拥堵时段的数据模式来预测其他时段是不合理的。现有的图卷积方法大多对于所有时间步共享权重,这忽略了交通数据中不同时间步之间的时空关联性的差异。
技术实现思路
1、考虑交通流数据通常是在道路网络上采集的,而传统的神经网络难以直接处理图结构数据。现有的研究大多使用图神经网络(gcn)来提取交通流特征,然而,基于gcn的方法大多使用局部邻域信息进行消息传递,导致模型对全局结构的感知能力不足,并且,由于图结构的限制,很难提取时空相似性。此外,现有的模型往往无法同时捕获交通流数据的短期和长期动态时间依赖。
2、因此,针对现有技术存在的缺陷和不足,本发明的目的在于提供一种基于动态时空相似金字塔网络的交通流预测方法,以能够有效支持交管部门进行交通管理以及决策。其中包括使用改进的多头时空自注意力提取交通流的动态长期特征、使用空间金字塔模块捕获全局空间信息和空间相似性、使用时间金字塔模块提取不同粒度的时间依赖、将时空块的输出通过残差连接传递到预测层,最终得到交通流预测结果。基于本方法得到的结果能够高效准确地预测城市道路的交通流量信息,准确发现城市道路中的异常拥堵或异常疏通,为交通管理部门制定交通调度和控制策略提供帮助。
3、其具体采用以下技术方案:
4、一种基于动态时空相似金字塔网络的交通流预测方法:
5、通过历史的道路传感器记录的车辆信息,考虑全局动态时空信息和交通数据的时空相似性,预测未来道路的交通流量;
6、使用改进的多头时空自注意力提取交通流的动态长期特征、使用空间金字塔模块捕获全局空间信息和空间相似性、使用时间金字塔模块提取不同粒度的时间依赖、将时空块的输出通过残差连接传递到预测层,最终得到交通流预测结果。
7、进一步地,包括以下步骤:
8、步骤s1:使用改进的多头时空自注意力提取交通流的动态长期特征;
9、步骤s2:使用空间金字塔模块捕获全局空间信息和空间相似性;
10、步骤s3:使用时间金字塔模块提取不同粒度的时间依赖;
11、步骤s4:将时空块的输出通过残差连接传递到预测层,得到交通流预测结果。
12、进一步地,
13、步骤s1具体包括:
14、步骤s1.1:使用多头时间自注意力捕获交通流的时间相关性;
15、步骤s1.2:将时间注意力模块的输出与上一个时空块中的时间注意力模块的输出通过残差连接,以传递和保留历史信息;
16、步骤s1.3:计算多头空间自注意力的相关性得分,用于调节空间金字塔每层的权重;
17、步骤s2具体包括:
18、步骤s2.1:使用自适应扩散图卷积捕获局部邻域信息,作为空间金字塔的第一层;
19、步骤s2.2:计算每个时间步的时空全局关联矩阵,提取图的边缘特征;
20、步骤s2.3:计算每个时间片与其相邻时间片的时空全局关联矩阵相似性,将均值作为该时间片所占的权重;
21、步骤s2.4:将结果进行拼接,作为空间金字塔的第二层,捕获节点全局信息;
22、步骤s2.5:将时空全局相似性模块的输出经过平均池化和1×1的卷积以提取路网级特征,作为空间金字塔第三层;
23、步骤s2.6:通过自上而下的路径和横向连接将低分辨率、语义强的特征与高分辨率、语义弱的特征结合,形成空间金字塔;
24、步骤s2.7:利用步骤s1.3计算出的空间注意力分数调节每层金字塔的权重;步骤s3具体包括:
25、步骤s3.1:使用金字塔门控tanh单元捕获交通流数据的动态时间信息;
26、步骤s3.2:使用可训练的参数修正每个时间金字塔层的权重。
27、进一步地,将交通路网定义为一个有向图其中为路网中的节点如传感器集合ε代表边的集合(|ε|=m),是路网图的邻接矩阵在每个时间片上,每个节点以相同的采样频率收集d个节点特征;交通信号表示交通路网中所有传感器在时间步t的观测值;给定历史交通信号交通预测问题旨在预测其中,p为给定历史时间步长,q为预测时间步长;则交通预测问题可以描述为学习从历史时间步p到下一个时间步q的映射函数f:
28、
29、对于m个独立同分布的观测值的集合{(x1,y1),(x2,y2),…(xm,ym)},假设矩阵表示基于观测值x计算的欧几里德距离矩阵,并计算欧几里德距离矩阵其中则布朗距离协方差(bdc)度量具有一个封闭形式的表达式:
30、ρ(x,y)=tr(atb) (2)
31、a=(akl)为时空全局关联stgc矩阵,其中,最后三项分别表示第l列、第k行以及中所有值的平均值;并通过相同的计算方法得到矩阵b;
32、由于stgc矩阵是对称的,因此ρ(x,y)表示为两个stgc向量a和b的内积,
33、ρ(x,y)=<a,b>=atb (3)
34、其中a,b是分别通过提取a,b的上三角部分然后进行矢量化而获得的。
35、进一步地,所述改进的多头时空自注意力具体为:
36、对于h个头的多头时间注意力,定义变量:
37、
38、其中,表示经过维度变换后的第l-1层时空块的输出,作为第l层时空块的输入,是可学习的参数;
39、计算每个头的注意力得分,并将时间注意力模块的输出与上一个时空块中的时间注意力模块的输出通过残差连接,以传递和保留历史信息,如下式所示:
40、
41、将所有注意力头的矩阵拼接在一起,归一化后得到将其作为输入传递到空间注意力模块,如下式所示:
42、m=layernorm(mlp(concat(head(1),…,head(h)))) (6)
43、使用一维卷积将时间注意力模块的输出m的时间维度p映射到维度de并聚合特征维度d(l-1),接着通过空间嵌入操作,得到
44、定义变量:
45、
46、计算空间注意力得分,如下式所示:
47、
48、表示查询向量q'(h)与键向量k'(h)之间的相关性;其中,获得的注意力得分,用于调节空间金字塔每层的权重。
49、进一步地,所述空间金字塔模块当中:
50、首先,根据节点之间是否存在连接来表示不同节点的接近度,如下式所示:
51、
52、随机初始化两个可学习的节点嵌入矩阵e1,e2∈rn×c实现自适应的邻接矩阵,如下式所示:
53、
54、将节点之间的状态转移描述为节点的空间扩散过程,并且通过在图上执行随机游走进行模拟;通过结合预定义的空间依赖关系和自学习的隐藏图依赖关系,计算自适应扩散图卷积层,如下式所示:
55、
56、其中ck表示转移矩阵的幂级数;在有向图的情况下,扩散过程有两个方向,前向和后向,其中前向转移矩阵后向转移矩阵表示输入信号,表示输出,表示模型参数矩阵;将其作为空间金字塔的第一层,捕获局部邻域信息;
57、将经过扩散图卷积处理的数据按时间维度进行切片,如下式所示:
58、
59、考虑以作为随机观测值,依次计算平方欧氏距离矩阵其中是z(i)的第k列和第l列之间的平方欧氏距离,欧氏距离矩阵以及减去其行均值、列均值和所有元素均值得到的stgc矩阵a:
60、
61、
62、
63、其中,jn∈rn×n是一个矩阵,每个元素都是1,i是单位矩阵,表示hadamard乘积;表示
64、然后计算出a(i)与a(j)之间的bdc度量,即时间片i与时间片j之间交通流量特征的相似性:
65、
66、其中a(i),a(j)分别为a(i),a(j)的向量表示;
67、当前时间片与其相邻时间片的相似性越大,说明其特征对于流量预测的影响越大;将其与相邻时间片特征相似性的均值作为该时间片所占的权重,最后进行拼接:
68、zs=relu(concat(a(1)s1,a(2)s2,…,a(p)sp)) (17)
69、其中,s(i)是z(i)与相邻时间片的bdc度量的均值;将其作为空间金字塔的第二层,捕获节点全局信息;
70、将时空全局相似性模块的输出进行平均池化,并经过一层1×1卷积以提取路网级特征,将其作为空间金字塔第三层;如下式所示:
71、zl=conv2d(1,1)(globalmeanpool(zs)) (18)
72、最后通过自上而下的路径和横向连接将低分辨率、语义强的特征与高分辨率、语义弱的特征结合,形成空间金字塔;
73、计算出的空间注意力分数调节每层金字塔的权重;假设每层金字塔输出为zj,则
74、
75、其中,j为空间金字塔的层数。
76、进一步地,所述时间金字塔模块当中:
77、首先为每个阶段定义一个金字塔级别,第i层金字塔的输入表示为设置卷积核为1×s,则:
78、
79、其中,*τ是门控卷积算子,e和f分别是相对于通道维度的前半部分和后半部分,k是每个金字塔级别中时间维度的缩减因子,通过自下而上的路径,提取不同尺度的时间依赖性;
80、除了最顶层的金字塔,在每个金字塔层上应用一个卷积核为1×1的gtu;通过自上而下的路径,低层金字塔融合来自更高金字塔级别的空间上更粗糙但语义上更强的特征图,并通过上采样操作产生具有更高分辨率的特征;
81、其次,通过横向连接,将特征图与自下而上的路径进行融合,作为该层金字塔的输出;
82、最后使用可训练的参数修正每个时间金字塔层的权重,如下式所示:
83、
84、其中,i为时间金字塔的层数,为每层时间金字塔的输出,w是可训练的参数。
85、相比于现有技术,本发明及其优选方案至少具备以下突出的有益效果:
86、创新性的提出了stgc矩阵,用于捕获全局空间信息,并且通过每个时间步的stgc矩阵的相似性,捕获路网中相邻时间步之间的空间相似性。
87、将多元时间序列转换为多层金字塔结构,能够有效提取不同尺度的时空特征。
88、通过改进的多头自注意力机制挖掘时空依赖关系,并自适应地调整局部、全局以及图级时空特征的权重,进一步增强模型对路网的动态时间依赖感知。
本文地址:https://www.jishuxx.com/zhuanli/20240731/187983.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表