技术新讯 > 信号装置的制造及其应用技术 > 一种基于自注意机制和深度学习的交通流预测方法  >  正文

一种基于自注意机制和深度学习的交通流预测方法

  • 国知局
  • 2024-07-31 21:18:55

本发明涉及一种基于自注意机制和深度学习的交通流预测方法,属于交通监测。

背景技术:

1、在现代城市中,交通流预测对于交通管理、智能交通系统和城市规划等领域具有重要意义。传统的交通流预测方法通常基于统计模型或时间序列分析的方法,但这些方法往往无法捕捉到交通数据中的复杂空间性和时间关联性。

2、同时,传统循环神经网络rnn模型在进行计算时需要依次处理输入序列中的每个时间步,且在处理很长的时间序列时,容易出现梯度消失或梯度爆炸的问题,导致难以学习长期依赖关系。

3、并且,目前交通流预测大多只对交通流的单一特征进行预测,在预测时存在信息瓶颈的缺陷,其中,信息瓶颈是指在机器学习模型中引入的约束,从而存在过拟合和性能下降的问题,从而会影响交通流的预测,最终影响交通流的干预。

技术实现思路

1、本发明提供一种基于自注意机制和深度学习的交通流预测方法,它解决了目前预测单一特征时而造成信息瓶颈,从而存在过拟合和性能下降,从而会影响交通流的预测,最终影响交通流干预的问题。

2、本发明所要解决的技术问题采取以下技术方案来实现:

3、一种基于自注意机制和深度学习的交通流预测方法,包括以下步骤:

4、s1、利用tcn收集包含x1-x6的六维交通流特征得重要特征;

5、s2、经bigru处理步骤s1中的重要特征,捕捉序列中的长距离依赖关系,得输出向量;

6、s3、将步骤s2中的输出向量输入至自注意机制层,获取不同位置的自注意力机制权重;将自注意力机制的输出被馈入一个全连接层,最终得tcn-bigru-自注意力机制交通流预测模型;

7、s4、基于步骤s3中的tcn-bigru-自注意力机制交通流预测模型预测某一时刻的交通流量,并对比该时段的真实交通流数据。

8、作为优选实例,在进行步骤s1之前,对x1-x6的六维交通流特征按照以下方式进行预处理;

9、使用pandas提取解析csv数据文件,根据时间戳和车牌号对交通流数据进行合并去重,保留成由时间戳、瞬时车速、经纬度构成的dataframe数据结构。

10、分别对冗余数据、异常车辆和缺失数据进行处理修复;

11、对于冗余数据:存在某些车辆在同一秒内有多个速度值甚至发生陡变的异常情况,找出并使用其中的中位数代表该车辆在该时间戳的瞬时速度;

12、对于异常车辆,某些车辆存在大量速度为零的记录,找出每辆车的零速记录比率,结合数据时空长度,考虑设定阈值0.6,将零速度比率大于等于0.6的车辆视为异常车辆,直接删除;

13、对于缺失数据,线性插值补充;

14、对上述所得到的数据进行特征提取(得到特征和标签),并对得到的特征数据进行归一化处理。

15、作为优选实例,在步骤s1中,采用下列方式由tcn收集x1-x6,避免梯度消失和爆炸,其中:x1、x2、x3为三个区间路段下的交通流量;x4表示在某一时段某个路口的车辆平均速度;x5表示在某一时段某个路口的交通拥挤或畅通情况;x6表示三段区间的总交通流量;

16、s1.1将输入的六维交通流数据转换为张量形式,然后按时间步进行堆叠,形成一个六维张量;

17、s1.2将通过卷积操作提取得到的六维特征数据同时输入到tcn中捕获时间序列数据中的长期依赖关系,公式如下:

18、

19、其中,是时间步t的输出,取值范围为[-1,1];xt-i是时间步t-i的输入,取值范围为[0,1];w-i是卷积核的权重,取值范围为[-∞,∞]。

20、作为优选实例,在s2中,输出向量按照下列方式而得,即在bigru中通过在时间序列上前向和后向传播信息来捕捉序列中的上下文和长期依赖关系,并提取时间序列的正反两个方向的时序特征,其中正向的gru模型接受正向输入,反向的gru学习反向的输入,具体步骤如下:

21、s2.1在前向gru计算中,使用以下公式计算隐藏状态

22、

23、其中,xt表示时间步t的输入特征,是前向gru的隐藏状态,σ是sigmoid激活函数,即,

24、

25、⊙表示按元素乘法,tanh是双曲正切激活函数,即,wf、uf、w′f、u′f、bf、b′f是前向gru的权重参数,且wf、uf、w′f、u′f、bf、b′f的取值范围均为[-1,1];

26、s2.2在反向gru计算中,使用以下公式计算隐藏状态

27、

28、其中:是反向gru的隐藏状态,wb、ub、w′b、u′b、bb、b′b是反向gru的权重参数,且wb、ub、w′b、u′b、bb、b′b取值范围均为[-1,1];

29、s2.3前向和反向计算后的输出结果为:

30、

31、其中:h是最终的输出结果,即输出向量,通过将前向和反向计算得到的隐藏状态按元素相加(⊕)得到。

32、作为优选实例,在步骤s3中,按照下列方式建立tcn-bigru-自注意力机制交通流预测模型;

33、步骤s3.1首先获取不同位置的自注意力机制权重矩阵:

34、h=a*v

35、其中:

36、

37、q表示查询矩阵、k表示键矩阵、v表示值矩阵,q、k、v的取值范围均为[-1,1];a是注意力权重矩阵,取值范围为[0,1];h是加权值向量,取值范围取决于a;w_q是查询权重矩阵,w_k是键权重矩阵,w_v是值权重矩阵,w_q、w_k、w_v的取值范围均为[-1,1];

38、步骤s3.2其次,按照下列公式将自注意力机制的输出被馈入一个全连接层,该层产生交通流预测,即tcn-bigru-自注意力机制交通流预测模型表达式为:

39、y=w_o*h+b_o

40、其中:y是模型输出,取值范围为[0,1];w_o是权重矩阵,取值范围为[-1,1];b_o是偏置向量。

41、作为优选实例,在步骤s4中,按照下列方式将预测某一时刻的交通流量与该时段真实交通流数据进行分析和对比:

42、

43、

44、

45、其中:mae表示平均绝对误差;mape表示平均绝对百分比误差;r2表示相关系数;yi表示i时刻真实的交通流量数据,表示i时刻预测的交通流量数据,n表示用于预测的样本数量;表示样本均值。

46、一种计算设备,包括处理器和用于存储处理器可执行程序的存储器,所述处理器执行存储器存储的程序时,实现如上述方法的步骤。

47、一种存储介质,存储有程序/指令,所述程序/指令被处理器执行时实现如上述方法的步骤。

48、一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现如上述方法的步骤。

49、本发明的有益效果是:

50、(1)本发明考虑到多维交通流数据的捕捉,能够更全面地对交通流数据进行预测,并且tcn-bigru-自注意机制模型是一个端到端模型,不需要复杂的特征工程,这使得其实现比其他方法更简单。同时该模型与表一的其他5个的预测模型相比,对交通流的预测值与真实值表现出较佳的性能。

51、(2)本发明利用自注意机制在处理数据时能够捕捉不同位置之间的关系和重要性,使模型能够更好地理解时间序列中的模式和趋势,从而提高预测的准确性;同时拥有强大的学习能力,通过对交通拥塞或通畅状态的预测,使得模型能够更好地适应复杂的交通流动性变化和模式,从而提高预测的准确性;

52、(3)在本发明中,通过将双向门控循环神经网络(bigru)和自注意机制的输出进行综合特征表示,将两种不同的特征融合在一起;此种融合能够更全面地捕捉序列中的信息,充分利用了不同方法的优势,从而提高预测的准确性。

53、(4)本发明准确的交通流预测可以对交通进行诱导控制和信号管理,有效的提升了人、车、路、环境之间的舒适度,是当下交通领域的研究重点方向之一。

本文地址:https://www.jishuxx.com/zhuanli/20240731/189220.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。