基于时空融合的短时车速预测

2022-12-20 20:58:49 来源：中国专利 TAG：

1.本发明涉及短时车速预测领域，具体的是基于时空融合的短时车速预测。

背景技术：

2.近年来，随着汽车保有量逐年递增，交通拥堵现象日益严重。精确并且实时的短时车速预测不仅有利于出行者的路径规划和时间安排，有效减少高峰时段的拥堵，也为交管部分制定前瞻性交通管理策略提供有力的支撑。如果可以准确预测道路未来的车速，那么在拥堵发生之前就可以采取一定措施来避免拥堵发生。因此，通过车辆自身的行为信息开发车速预测算法对高速公路车辆的先进控制具有重要现实意义。
3.为提高短时车速的预测精度，已有学者进行了大量的研究。短时车速预测模型总结起来可以分为统计模型、机器学习。其中统计模型中典型的代表是差分自回归移动平均(arima)模型，就是通过时间序列数据来确定参数后基于回归函数来预测。但是arima模型适合于线性的数据预测，对于非线性强度较高的交通流预测有一定的局限性。机器学习包括支持向量机(svm)模型和贝叶斯网络模型等，该方法是从历史数据中发现车速变化的规律，能够很好的反应车速的非线性，由于机器学习难以挖掘长时间序列特征，无法充分学习路段行程车速的变化规律，预测效果不佳。
4.随着深度学习的兴起，神经网络被广泛应用于交通预测领域，以其强大的学习能力和自适应能力受到国内外许多学者的关注。长短时记忆网络(lstm)、门控循环单元(gru)这类单一的深度学习模型的提出在预测领域展现出一定优势，但依旧存在精度不高的问题。近些年来，lstm与卷积神经网络(cnn)组合模型被大量应用，根据现有的研究，混合模型往往比单一模型预测精度高。然而，车速数据的非线性和不确定性，且其变化不单单受时间因素的影响，车速还受到其上下游车速的影响，因此数据的噪声和路网空间结构也是需要考虑的因素，目前缺乏一种高精度的短时车速预测模型。

技术实现要素：

5.为解决上述背景技术中提到的不足，本发明的目的在于提供一种基于时空融合的短时车速预测，交通拥堵带来的经济损失、环境污染、能源浪费等问题日益加重，精准的短时车速预测能够帮助城市缓解城市交通拥堵问题。为了解决背景技术中存在的问题，注意到双向长短时记忆网络被广泛的应用到车速预测中，但是车速的变化不仅受时间的影响还受空间的影响，从而只从时间维度进行预测会影响预测精度。鉴于图卷积神经网络(gcn)能够处理非欧式结构的数据，本文将gcn与bilstm相结合来挖掘出短时车速的时空特性。进一步的，为了减少噪声对车速数据的干扰，引入变分模态分解(vmd)进行降噪，提出了 vmd-gcn-bilstm短时车速预测模型，从而达到更科学的手段，提高短时车速预测精度的目的。
6.本发明的目的可以通过以下技术方案实现：
7.一种基于时空融合的短时车速预测，包括以下步骤：
8.步骤1：对gcn进行数学建模
9.gcn能够处理任意图结构数据，可分为基于频谱方法和基于空间方法，选用的是基于频谱方法，
10.在频谱图卷积层中，最能反映图得结构性质的就是图卷积拉普拉斯矩阵l，其公式如式(1)所示，
[0011][0012]
其中，d为度矩阵，a为邻接矩阵，in为单位矩阵，
[0013]
区别与经典卷积算子的卷积操作，图卷积是利用定义在傅里叶域中对角的线性算子来实现卷积操作，其公式如式(2)所示，
[0014]gθ
*x＝ug
θut
x
ꢀꢀꢀ
(2)
[0015]
其中，g
θ
为卷积核，u是由l的特征向量组成，对于图结构较大的情况，可采用切比雪洛夫多项式近似求解，因此，图卷积的层间传播公式如(3)，
[0016][0017]
其中，为邻接矩阵与单位矩阵之和，为的度矩阵，h
(l)
为第l层的特征矩阵，w
(l)
为第l层的权重矩阵，σ为激活函数，
[0018]
步骤2：对gcn-bilstm进行数学建模
[0019]
本发明经过gcn网络来捕捉车速空间特征，得到车速序列的空间特征向量，再将空间特征向量输入到bilstm网络中，挖掘时间特征，bilstm在lstm的基础上进一步地改进，由前向lstm和后向lstm组成，bilstm不仅能够过往状态的记忆性，且具备对未来状态依赖性，bilstm结构图如图2所示，
[0020]
序列数据通过输入层进入隐藏层分别进行正向、反向计算，最终输出结果由输出层按照一定的权重融合正向lstm输出结果和反向lstm输出结果得到， bilstm隐藏输出计算公式如式(4)-(6)所示，
[0021][0022][0023][0024]
其中，和为q时刻的前向和后向隐藏层状态，lstm为隐藏运算过程，yq代表q时刻输入的时空关联向量，hq为q时刻bilstm隐藏层状态向量，α，β分别代表前向和反向隐藏层输出权重，
[0025]
步骤3：对vmd-gcn-bilstm进行数学建模
[0026]
变分模态分解解决了经验模态分解(emd)中存在的端点效应和模态分量混叠的问题，具有可以确定模态分解的个数的优点，其自适应性表现在根据实际情况确定所给序列的模态分解个数，与emd相比采用了非递归的分解模式，通过构建变分问题使得分解结果稳定，
[0027]
步骤4：设置超参数
[0028]
vmd-gcn-bilstm模型的主体是vmd处理分解信号，分解后的信号输入2个拼接的
gcn层、2个bilstm层和1个全连接层，2层gcn通道主要是用来提取车速的空间特征，而加入的biltm层用来提取车速的时间特征，
[0029]
首先，由于每天会出现上下班高峰期，原始车速数据存在奇异值，为了避免奇异样本数据导致不良影响以及加快梯度下降求最优解的速度，在信号分解前采取将数据限定在一定范围内，即归一化处理，归一化公式如式(7)
[0030][0031]
其中x是原始数据，x
min
是原始数据中最小值，x
max
是原始数据中最大值，
[0032]
其次，将归一化的车速数据投入分解模块，通过vmd算法将数据分解成多个imf分量，得到不同频率下的时间序列，减少了噪声对后续模型预测性能的影响，
[0033]
接下来的训练部分，采用两层的gcn捕捉车速的空间特征学习，利用两层的bilstm挖掘时间特征，
[0034]
最后，经过全连接层得到每个子序列的预测值，再将预测分量求和输出的预测结果，
[0035]
步骤5：用其他时间序列预测方法与本发明比较
[0036]
对本发明方法进行训练，得到本发明的三个性能指标平均绝对误差(mae)、均方根误差(rmse)和决定系数(r2-score)等各种指标，并在同一数据集同一计算机下对其他时间序列预测方法进行比较。
[0037]
作为本发明的一种优选方案，vmd分解具体包括以下步骤：
[0038]
(1)：首先通过式(8)-(9)构建变分约束问题
[0039][0040][0041]
其中k为分解的模态个数，{uk}、{ωk}分别为分解后第k个模态的分量和中心频率，δ(t)为狄拉克函数，
[0042]
(2)：通过式(10)转变约束变分问题，
[0043][0044]
其中α为二次惩罚因子，λ为拉格朗日乘法算子，
[0045]
(3)：搜寻增广lagrange函数的鞍点，交替寻优迭代后的{uk}、{ωk}和λ，表达式为式(11)-(13)，
[0046][0047]
[0048][0049]
其中式中γ表示噪声容忍度，分别对应 ui(t)、f(t)和λ(t)的傅里叶变换。
[0050]
本发明的有益效果为：
[0051]
本发明针对车速数据存在非线性和不稳定，利用vmd分解，使得分解后的数据更加平稳；在空间上车速受路网的影响，利用gcn网络挖掘空间特征；在时间上车速受前几个时段的车速影响，利用bilstm网络捕捉车速的时间特征。基于此，本发明提出vgblstm预测模型来提高预测精度。通过实验验证，发现本发明能够克服单一模型存在的缺陷，同时与现有的组合模型相比，预测精度也进一步的得到提升。本发明可以准确的预测短时车速，为交通部门提供了有利的参考价值。
附图说明
[0052]
下面结合附图对本发明作进一步的说明。
[0053]
图1是本发明gcn结构图；
[0054]
图2是本发明bilstm结构图；
[0055]
图3是本发明整体流程图。
具体实施方式
[0056]
下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例，都属于本发明保护的范围。
[0057]
一种基于时空融合的短时车速预测，包括以下步骤：
[0058]
步骤1：对gcn进行数学建模
[0059]
gcn能够处理任意图结构数据，可分为基于频谱方法和基于空间方法，选用的是基于频谱方法，
[0060]
在频谱图卷积层中，最能反映图得结构性质的就是图卷积拉普拉斯矩阵l，其公式如式(1)所示，
[0061][0062]
其中，d为度矩阵，a为邻接矩阵，in为单位矩阵，
[0063]
区别与经典卷积算子的卷积操作，图卷积是利用定义在傅里叶域中对角的线性算子来实现卷积操作，其公式如式(2)所示，
[0064]gθ
*x＝ug
θut
x
ꢀꢀꢀ
(2)
[0065]
其中，g
θ
为卷积核，u是由l的特征向量组成，对于图结构较大的情况，可采用切比雪洛夫多项式近似求解，因此，图卷积的层间传播公式如(3)，
[0066]
[0067]
其中，为邻接矩阵与单位矩阵之和，为的度矩阵，h
(l)
为第l层的特征矩阵，w
(l)
为第l层的权重矩阵，σ为激活函数，
[0068]
步骤2：对gcn-bilstm进行数学建模
[0069]
本发明经过gcn网络来捕捉车速空间特征，得到车速序列的空间特征向量，再将空间特征向量输入到bilstm网络中，挖掘时间特征，bilstm在lstm的基础上进一步地改进，由前向lstm和后向lstm组成，bilstm不仅能够过往状态的记忆性，且具备对未来状态依赖性，bilstm结构图如图2所示，
[0070]
序列数据通过输入层进入隐藏层分别进行正向、反向计算，最终输出结果由输出层按照一定的权重融合正向lstm输出结果和反向lstm输出结果得到， bilstm隐藏输出计算公式如式(4)-(6)所示，
[0071][0072][0073][0074]
其中，和为q时刻的前向和后向隐藏层状态，lstm为隐藏运算过程，yq代表q时刻输入的时空关联向量，hq为q时刻bilstm隐藏层状态向量，α，β分别代表前向和反向隐藏层输出权重，
[0075]
步骤3：对vmd-gcn-bilstm进行数学建模
[0076]
变分模态分解解决了经验模态分解(emd)中存在的端点效应和模态分量混叠的问题，具有可以确定模态分解的个数的优点，其自适应性表现在根据实际情况确定所给序列的模态分解个数，与emd相比采用了非递归的分解模式，通过构建变分问题使得分解结果稳定，
[0077]
步骤4：设置超参数
[0078]
vmd-gcn-bilstm模型的主体是vmd处理分解信号，分解后的信号输入2个拼接的gcn层、2个bilstm层和1个全连接层，2层gcn通道主要是用来提取车速的空间特征，而加入的biltm层用来提取车速的时间特征，
[0079]
首先，由于每天会出现上下班高峰期，原始车速数据存在奇异值，为了避免奇异样本数据导致不良影响以及加快梯度下降求最优解的速度，在信号分解前采取将数据限定在一定范围内，即归一化处理，归一化公式如式(7)
[0080][0081]
其中x是原始数据，x
min
是原始数据中最小值，x
max
是原始数据中最大值，
[0082]
其次，将归一化的车速数据投入分解模块，通过vmd算法将数据分解成多个imf分量，得到不同频率下的时间序列，减少了噪声对后续模型预测性能的影响，
[0083]
接下来的训练部分，采用两层的gcn捕捉车速的空间特征学习，利用两层的bilstm挖掘时间特征，
[0084]
最后，经过全连接层得到每个子序列的预测值，再将预测分量求和输出的预测结
果，
[0085]
步骤5：用其他时间序列预测方法与本发明比较
[0086]
对本发明方法进行训练，得到本发明的三个性能指标平均绝对误差(mae)、均方根误差(rmse)和决定系数(r2-score)等各种指标，并在同一数据集同一计算机下对其他时间序列预测方法进行比较。
[0087]
作为本发明的一种优选方案，vmd分解具体包括以下步骤：
[0088]
(1)：首先通过式(8)-(9)构建变分约束问题
[0089][0090][0091]
其中k为分解的模态个数，{uk}、{ωk}分别为分解后第k个模态的分量和中心频率，δ(t)为狄拉克函数，
[0092]
(2)：通过式(10)转变约束变分问题，
[0093][0094]
其中α为二次惩罚因子，λ为拉格朗日乘法算子，
[0095]
(3)：搜寻增广lagrange函数的鞍点，交替寻优迭代后的{uk}、{ωk}和λ，表达式为式(11)-(13)，
[0096][0097][0098][0099]
其中式中γ表示噪声容忍度，分别对应 ui(t)、f(t)和λ(t)的傅里叶变换。
[0100]
选取洛杉矶高速公路上采集到的公开车速据集。本发明模型采用了python 语言进行编写，其流程图如3所示。具体实施步骤如下：
[0101]
s1：模型输入的是每条路段不同时间段的车速数据以及由各个路段之间关系的邻接矩阵。
[0102]
s2：由于每天会出现高峰时段，车速原始数据存在奇异值，为了减少奇异值对原始数据造成不必要的影响以及加快梯度下降，将车速原始数据进行归一化处理，接着利用vmd模块将车速原始数据分解成几个频率不同的子序列，消除数据波动，提高预测精度。
[0103]
s3：按照步骤1和步骤2的方法对gcn、gcn-bilstm进行建模。
[0104]
s4：首先，将所有序列的vmd模态分量输入到gcn层中，经gcn网络学习捕捉车速数据的空间特征，得到车速序列的空间特征向量。其次，将特征向量输入到bilstm层中，挖掘特征向量的时间特征，得到时空特征向量。最后，将特征向量传给全连接层，输出每个分量预测结果。
[0105]
s5：将每个分量的预测进行加权求和，再进行归一化，最终输出预测结果。
[0106]
s6：设置参数。实验是在python 3.7环境中使用tensorflow框架完成模型的搭建和训练。本发明选用编号为773869的公路为预测点，其余公路为探测点；选用前6天为训练集，最后1天为测试集；模型设置滑动窗口为6，预测下 1个时间尺度；将车速数据分解为5个分量。在gcn-bilstm中将批量次数设置为64，训练次数为100，隐藏单元层为64，选用adam优化器。模型在训练中，学习率太小，就会导致收敛速度太慢，学习率太大就不会收敛，因此本文采用动态变化的学习率。
[0107]
训练过程中为了避免过拟合，将损失函数设置为公式(14)。
[0108][0109]
其中lr为正则化项，为了防止过拟合，λ为损失函数的超参数。通过调参，本发明λ设置为0.002。
[0110]
s7：用其他时间序列预测方法与本发明比较。为了验证本发明提出模型的有效性，选用了均方误差(rmse)、平均绝对误差(mae)、以及决定系数r2_score 作为本发明的评价指标。其评价指标的定义式分别为式(15)-(17)。
[0111][0112][0113][0114]
其中，y
t
表示路段在t时刻车速真实值，表示路段在t时刻车速预测值，表示路段在t时刻车速平均值，n表示样本的数量。rmse和mae表示预测结果的误差情况，其值越小越表示预测结果越好；r2_score表示回归方程的拟合程度，其值越大表示预测性能越好。
[0115]
将本发明的模型在公开数据集上与另外的6种模型在3个指标上进行实验对比，得到预测点对比结果见表1。
[0116]
表1：指标对比
[0117][0118][0119]
由表1可以看出，vmd-gcn-bilstm相比其他模型在跑同一组车速数据时，本发明模型在三种性能指标上表现出良好的性能，时间序列的预测精度有进一步的提升。本发明可以精准的预测短时车速的情况，为出行者提供了一定的参考价值。
[0120]
在本说明书中，对上述术语的示意性表述不一定指的是相同的实施例或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
[0121]
以上显示和描述了本发明的基本原理、主要特征和本发明的优点。本行业的技术人员应该了解，本发明不受上述实施例的限制，上述实施例和说明书中描述的只是说明本发明的原理，在不脱离本发明精神和范围的前提下，本发明还会有各种变化和改进，这些变化和改进都落入要求保护的本发明范围内。
[0122]
以上所述仅为本发明的较佳实施例而已，并不用以限制本发明，凡在本发明实质内容上所作的任何修改、等同替换和简单改进等，均应包含在本发明的保护范围之内。

再多了解一些

1/2 1 2 下一页尾页

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：一种测试任务的测试资源分析方法及相关设备与流程

基于时空融合的短时车速预测

相关文献

最热文献