基于STZINB-GCN的城际拼车的OD对区域需求预测方法、装置、设备和介质
- 国知局
- 2024-08-05 12:10:25
本发明涉及城际客运拼车规划,具体而言,涉及一种基于stzinb-gcn的城际拼车的od对区域需求预测方法、装置、设备和介质。
背景技术:
1、城际客运领域,拼车服务正日益成为主流出行方式之一。与需要前往特定站点的短途高铁相比,拼车服务依托网约车平台,为乘客提供从家门口到目的地的无缝连接,显著提升了出行的便捷性和灵活性。在成本方面,拼车服务通过匹配出发点、目的地及出发时间相近的乘客,共同分摊车费,有效降低了个人出行成本。
2、城际拼车平台通过预测乘客出行需求,灵活调度车辆资源,能够有效提高车辆使用率,服务更多共享出行人群。城际拼车的od对(origin-destination对、出发地-目的地对)区域需求预测面临的挑战主要在于城市内和城际间复杂的时空相关性和高时空分辨率下的数据稀疏性问题。
3、空间相关性方面,不仅受城市内部区域出行需求的相互影响,还涉及起讫城市区域间的相互影响,同时城市内以及起讫城市功能相似的区域出行需求存在空间相关性。
4、时间相关性方面,区域需求预测不仅与城市内的历史需求趋势和周期等相关,还会与区域历史净流入的乘客相关。在先技术中,为了捕捉星期之间的时间相关性,采用独热编码或者周期函数对星期类别进行映射。但是该技术方案无法体现例如星期日相较于星期一城际出行需求较大的这种时间相关性。
5、数据稀疏方面的问题,导致传统确定性深度学习模型的高斯假设不再适用。
6、在乘客需求预测方面,现有专利(专利号:zl202311132916.8)仅针对出发城市区域进行需求预测,未能提供完整的乘客出行信息,其预测出的乘客出行信息不包括乘客的目的地,无法进行最优的拼车服务,这限制了拼车服务的优化。
7、目前,大多数od对需求预测模型侧重于使用规则网格或行政区域划分,考虑相邻区域需求对预测的影响以及历史需求的影响。然而,这些方法可能因道路不通或绕路问题而受限,且难以准确捕捉功能相似区域间的出行需求空间相似性。此外,历史需求的随机性使得时间相关性的学习变得更加复杂。因此,城际拼车的od对区域需求预测仍需寻找更为有效的解决方案。
技术实现思路
1、本发明提供了一种基于stzinb-gcn的城际拼车的od对区域需求预测方法、装置、设备和介质,以改善上述技术问题中的至少一个。
2、第一方面、本发明实施例提供了一种基于stzinb-gcn的城际拼车的od对区域需求预测方法,其包含步骤s1至步骤s5。
3、s1、获取城际拼车的历史订单数据,并从历史订单数据提取城市a的历史需求特征、历史流入特征和时间信息特征,以构建总数据集。然后,按照预设的步长分割数据,获取输入数据。
4、s2、获取od对邻接关系图。
5、s3、根据所述输入数据,通过深度卷积隔开每个通道的信息对时间信息进行压缩,并通过两层卷积前馈网络,获得各个特征以及各个通道的时间相关性信息。
6、s4、根据所述输入数据和所述od对邻接关系图,通过三层扩散图卷积神经网络,将空间相关性建模为扩散过程,学习从一个od对到另一对的空间依赖性信息。
7、s5、将所述时间相关性信息和所述空间依赖性信息通过哈达玛积进行融合,捕获时空依赖性,并将融合后的时间空间信息通过零膨胀负二项分布解码成真实分布,获取预测值。
8、在一个可选的实施例中,步骤s1包括步骤s11至步骤s16。
9、s11、获取城际拼车的历史订单数据。式中,为出发地,为目的地,为出发时间,为订单经纬度。
10、s12、根据所述历史订单数据,获取时间步长内所有od对的历史需求特征,即城市a的所有区域在时间步长内去往城市b所有区域的历史需求特征。历史需求特征的表达式为:式中,表示所有od对在时间片段的历史需求特征,,为od对的序号,为od对的集合,表示第个od对在时间片段内的历史需求向量;表示第个od对在前一天时间片段的出行需求。表示第个od对在前一周时间片段的出行需求。表示第个od对历史一周时间片段最高出行需求。表示第个od对历史一周时间片段最低出行需求。表示第个od对历史一周时间片段平均出行需求。
11、s13、根据所述历史订单数据,获取时间步长内od对的历史流入特征,即城市b的所有区域在时间步长内净流入城市a的乘客人数。表达式为:式中,表示所有od对在时间片段的净流入城市a的所有区域的乘客人数。表示第个od对在时间片段的净流入城市a的所有区域的乘客人数,为od对的序号,为od对的集合。
12、s14、根据所述历史订单数据,获取od对时间信息特征集合。od对时间信息特征集合的表达式为:式中,为星期类别。为周末特征,周末值为1,工作日值为0。为节假日特征,节假日为1,工作日为0。
13、s15、将历史需求特征、历史流入特征,以及时间信息特征构建为总数据集。
14、s16、将所述总数据集按照预设的时间段数量或者预设的时间步长划分为输入数据。
15、在一个可选的实施例中,步骤s2具体为:获取城市间的路网信息和兴趣点数据,并对路网信息进行数据剔除和拓扑处理以对城市进行区域划分,对划分得到的区域进行区域poi标识,然后获取城市间的od对邻接关系图。其中,所述城市间包含城市a和城市b。
16、在一个可选的实施例中,步骤s2包括步骤s21至步骤s27。
17、s21、在openstreetmap的官网,获取起讫城市的路网信息。式中,为城市主要车行道路,为城市次要车行道路,为第三级道路,为高速公路,为快速路,为居民区道路。
18、s22、根据路网信息通过arcgis软件进行数据剔除和拓扑处理对起讫城市进行区域划分,获取城市区域间的od对。
19、s23、在商用地图软件的官网,获取城市的兴趣点数据。式中,为名称,为地址,为坐标,为类别。
20、s24、根据划分得到的区域对获取的poi数据进行区域标识,获取各个区域的poi数量。
21、s25、由tf-idf算法对每个od对中每类poi计算权重。其中,所述tf-idf算法的表达式为:式中,为城市a的区域的poi权重,为城市a的区域的词频,为城市a的区域内一类poi的数量,为城市a的区域内poi总数,为城市b的区域的poi权重,为城市b的区域的词频,为城市b的区域内一类poi的数量,为城市b的区域内poi总数,为逆文档频率,为od对的数量数,为包含一类poi的od对的数量。
22、s26、根据权重由余弦相似度计算od对之间poi相似度。其中,所述余弦相似度的表达式为:式中,为余弦相似度值,表示所有城市a的区域的poi权重向量,表示所有城市b的区域的poi权重向量。poi相似度矩阵的表达式为:式中,表示第个od对与第个od对的poi相似度。
23、s27、根据所述poi相似度矩阵,构建起讫城市od对的邻接矩阵。其中,起讫城市的od对邻接关系图的表达式为:式中,表示城市a的区域与城市b的区域构成的节点集合,城市a和城市b划分区域集合和,、,构成个od对,即,是poi相似度矩阵。
24、在一个可选的实施例中,步骤s3具体包括步骤s31至步骤s33。
25、s31、将输入数据输入到一维深度可分离卷积层经过深度卷积和逐点卷积结合运算,进行特征提取和嵌入操作,得到第一嵌入特征。其中,深度卷积和逐点卷积结合运算的表达式:式中,为第一嵌入特征、为卷积输入数据的特征数、表示深度卷积输出的时间嵌入特征,和分别卷积核中的权重和偏置项,深度卷积核尺寸为、为输入数据。小写符号的、和表示其对应特征的序号。
26、s32、将所述第一嵌入特征输入到通道分组卷积层,以捕获每个变量的新特征表示,以及学习特征和变量之间的依赖关系,获取第二嵌入特征。其中,通道分组卷积的表达式为:式中,为第二嵌入特征、表示连接操作、为第一嵌入特征、表示卷积操作、表示卷积核的权重,表示卷积核的偏置项。
27、s33、将第二嵌入特征输入变量分组卷积层,以捕获每个特征的跨变量依赖关系,以及混合跨特征和变量维度的信息,补充第二嵌入特征中学到的特征表示,获取第三嵌入特征。其中,第三嵌入特征为时间相关性信息嵌入。变量分组卷积的表达式为:式中,为第三嵌入特征、表示连接操作,为第二嵌入特征、表示卷积操作、表示卷积核的权重、表示卷积核的偏置项。
28、在一个可选的实施例中,步骤s4具体包括步骤s41至步骤s45。
29、s41、将所述输入数据和所述od对邻接关系图输入到扩散图卷积网络,对输入数据和od对邻接关系图进行形状变换。其中,形状变换为转置操作。
30、s42、在od对邻接关系图上进行随机游走,获取一个前向转移矩阵。其中,前向转移矩阵的表达式为:式中,表示前向转移矩阵、是poi相似度矩阵、上标代表矩阵转置。
31、s43、经过次扩散步骤,扩散过程的马尔可夫性质保证前向转移矩阵收敛到一个稳态分布,的每一行代表从该节点扩散的概率,表示实数集,为od对的数量。其中,稳态分布的计算公式为:式中,为扩散步骤总次数、为扩散步骤的索引、为转移概率,、是节点度矩阵、是节点度矩阵的逆矩阵、是poi相似度矩阵。
32、s44、经过次扩散步骤,扩散过程产生询问的扩散矩阵,输入数据经过多层的扩散操作后产生新的特征数据,然后将原始的输入数据与扩散后新的特征数据进行拼接得到总特征数据,然后对总特征数据进行卷积操作,再通过激活函数得到最后输出。其表达式为:式中,为扩散步骤的索引、表示第次扩散得到的特征数据、为扩散矩阵、表示总特征数据、表示拼接操作、为输入数据、为卷积核权重、是卷积偏置项、为最后输出、为激活函数。
33、s45、将所述最后输出输入最后一层扩散图卷积网络的二维卷积,然后使用函数保证为正数,使用函数保证,获取空间依赖性信息嵌入。其中,三层扩散图卷积网络分别设置有一个二维卷积。和表达式为:式中,为最后输出、为自然底数。
34、在一个可选的实施例中,步骤s5具体包括步骤s51至步骤s55。
35、s51、负二项分布中引入一个新的参数学习零的膨胀,从而得到零膨胀负二项分布。其中,零膨胀负二项分布的表达式为:式中,为零膨胀负二项分布、为负二项分布、为输入的数据、为零膨胀的学习参数、和分别是决定成功次数和单词失败概率的形状参数。
36、s52、由扩散图卷积网络(d-gcn)得到的空间依赖性信息,以及由时间卷积网络得到的时间相关性信息,用于参数化零膨胀负二项分布。空间依赖性信息和时间相关性信息包含了对其空间和时间局部性的零膨胀负二项分布参数的独立估计。
37、时空嵌入表达式为:式中,和分别为时间卷积网络中以及扩散图卷积网络中的卷积用于计算特征嵌入,为输入数据、是poi相似度矩阵。
38、二维卷积操作的表达式为:式中,二维卷积核尺寸为,为输入数据的特征数。为输入数据、表示卷积核中的权重、表示偏置项、小写符号的、和表示其对应特征的序号。
39、s53、利用哈达玛积将空间依赖性信息和时间相关性信息融合,获取最终满足零膨胀负二项分布参数集。其中,最终满足零膨胀负二项分布参数集的表达式为:式中,表示哈达玛积运算符,表示对应元素相乘,、和分别表示空间信息嵌入的第一参数、第二参数和第三参数,、和分别为时间相关性信息嵌入的第一参数、第二参数和第三参数。
40、s54、根据所述满足零膨胀负二项分布参数集,得到未来预测时间步长的概率质量函数,获取预测值。
41、第二方面、本发明实施例提供了一种基于stzinb-gcn的城际拼车的od对区域需求预测装置,其特征在于,包含数据获取模块、关系图获取模块、时间特征提取模块、空间特征提取模块和融合解码模块。
42、数据获取模块,用于获取城际拼车的历史订单数据,并从历史订单数据提取城市a的历史需求特征、历史流入特征和时间信息特征,以构建总数据集。然后,按照预设的步长分割数据,获取输入数据。
43、关系图获取模块,用于获取od对邻接关系图。
44、时间特征提取模块,用于根据所述输入数据,通过深度卷积隔开每个通道的信息对时间信息进行压缩,并通过两层卷积前馈网络,获得各个特征以及各个通道的时间相关性信息。
45、空间特征提取模块,用于根据所述输入数据和所述od对邻接关系图,通过三层扩散图卷积神经网络,将空间相关性建模为扩散过程,学习从一个od对到另一对的空间依赖性信息。
46、融合解码模块,用于将所述时间相关性信息和所述空间依赖性信息通过哈达玛积进行融合,捕获时空依赖性,并将融合后的时间空间信息通过零膨胀负二项分布解码成真实分布,获取预测值。
47、第三方面、本发明实施例提供了一种基于stzinb-gcn的城际拼车的od对区域需求预测设备,其特征在于,包括处理器、存储器,以及存储在所述存储器内的计算机程序。所述计算机程序能够被所述处理器执行,以实现如第一方面任意一段所述的一种基于stzinb-gcn的城际拼车的od对区域需求预测方法。
48、第四方面、本发明实施例提供了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述计算机可读存储介质所在设备执行如第一方面任意一段所述的一种基于stzinb-gcn的城际拼车的od对区域需求预测方法。
49、通过采用上述技术方案,本发明可以取得以下技术效果:
50、本发明实施例的一种基于stzinb-gcn的城际拼车的od对区域需求预测方法基于历史需求序列以及历史流入序列预测未来起讫城市按路网信息划分区域的乘客需求预测。通过提前预测od对的乘客出行需求,相关运输机构能够灵活地配置车辆,实现多人拼车共享出行的目标,提高车辆的利用率。
51、此外,本发明实施例在面对高时空分辨率下数据稀疏时仍具有较高的精度,解决了城市内和城际间区域的复杂时空相关性,对城际拼车的od对需求预测提供了很好的解决方案,满足了现实生活中城际拼车的od对区域需求预测。
本文地址:https://www.jishuxx.com/zhuanli/20240802/261377.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表