时空门机制迁移的异源城市出租车轨迹生成方法及系统
- 国知局
- 2024-09-05 14:51:14
本发明涉及智能交通,尤其涉及一种时空门机制迁移的异源城市出租车轨迹生成方法及系统。
背景技术:
1、交通轨迹数据是指记录车辆在一段时间内的移动路径信息,通常包括经度、纬度和时间戳等字段的一系列数据点。这些数据点串联起来,形成了个体在空间和时间上的移动轨迹。在交通规划中,轨迹数据有助于确定道路建设的优先级,优化信号灯调度,以及为导航系统提供实时交通信息。对于网约车车辆调度,轨迹数据能够帮助预测需求热点,从而优化车辆分布,减少乘客等待时间,并提高运营效率。
2、交通轨迹生成对于交通轨迹数据的意义在于,它可以模拟和预测现实中可能发生的交通轨迹,尤其是在数据不完整或无法直接获取的情况下。通过生成对抗训练下的图神经网络(gnns),可以模拟出与实际交通状况相似的轨迹数据,为交通规划和管理提供更为丰富的数据支持。然而,由于隐私和商业限制,我们往往只能获取到有限的轨迹样本,这导致深度生成模型在训练时学习不充分。这种稀疏性使得模型难以捕捉到所有可能的交通模式,从而影响生成轨迹数据的真实性和质量。
技术实现思路
1、针对城市交通轨迹数据的稀疏性这一问题,本发明的目的是提供一种时空门机制迁移的异源城市出租车轨迹生成方法及系统,通过迁移学习和其他先进技术,提高模型在稀疏数据上的学习效果,从而生成更高质量的交通轨迹数据。
2、为达到上述目的,本发明采用的技术方案是:
3、一种时空门机制迁移的异源城市出租车轨迹生成方法,包含如下步骤:
4、s1:数据源的采集与处理:整合来自异源城市的出租车轨迹数据,并进行数据清洗和预处理,将异源数据进行路网匹配,使用openstreetmap中的路网信息将经纬度点序列转换为连续的道路序列;
5、s2:构建异源城市交通轨迹的时空迁移元模型:首先,构建公共交通轨迹时空编码器t’,其中,i表征各城市的编码器,以捕捉交通轨迹数据中的通用特征;其次,为每个城市构建一个交通轨迹时空编码器ti,以学习各自城市的交通特征,在每一轮元训练时,使用maml进行公共编码器t’向源城市编码器ti的参数克隆,每一轮元训练结束后在公共编码器t’上执行梯度下降,以优化其参数;
6、s3:模型迁移:元模型包含了通用特征,通过元学习在多个源城市之间共享参数以学习通用特征。源模型则是在富含轨迹数据的源城市上训练得到的,涵盖源城市的通用和特定特征。而目标模型是在数据相对匮乏的目标城市上训练得到的,通过迁移学习源城市的特征以提高目标城市的预测性能。首先,将在源城市上训练得到的源模型中的共享参数复制到目标模型中,以保持两个模型在结构上的一致性;接着,利用目标城市的时空编码轨迹数据对模型进行内部更新,调参优化模型的私有参数,以适应目标城市的特定交通特征,在目标城市的数据集上,所述模型经历多次迭代训练,通过梯度下降和反向传播方法更新模型参数,最小化轨迹预测误差;同时,在内部更新过程中,目标模型的共享参数定期与源模型的共享参数同步,确保源城市的通用知识得以迁移至目标城市;过程中,以平均位移误差和最终位移误差作为评估指标对所述模型定期进行性能评估,确保模型在目标城市数据上的表现持续提升,待微调完成后,使用目标城市测试集对所述模型进行最终测试,全面评估模型在实际应用中的性能表现;
7、s4:预测轨迹下一跳:通过transformer模型对已处理的轨迹数据进行训练,利用训练好的模型进行轨迹预测,根据当前位置预测下一跳的道路,采用道路相邻的拓扑结构mask机制来约束预测结果,保证轨迹的连续性。
8、进一步地,所述步骤s1中,数据源的采集与处理包含数据获取与路网匹配,具体步骤如下:
9、数据获取:通过数据提供商或开放数据平台获取不同城市出租车的gps轨迹数据,所述数据包括:车辆运行的经纬度坐标、时间戳、路段长度、路段宽度、最大限速、车道数、道路类型;
10、路网匹配:利用openstreetmap提供的路网信息,建立一个包含道路节点、路段及其拓扑关系的路网数据模型,采用fastmm算法将出租车轨迹的gps点与上述路网数据模型进行匹配,将gps点数据转换为连续的轨迹,具体操作包括:将路网数据转换为图结构并进行简化,为每条边分配唯一标识符并计算边的长度和方向;对每个gps点,使用空间索引快速找到最近的边或节点,并基于距离和角度阈值生成候选集;采用误差模型估计gps点的观测误差,并计算候选集中每条边的概率密度;利用动态规划viterbi算法搜索最可能的路径,考虑路径的连续性和整体概率;对匹配结果进行平滑处理和错误匹配修正,以提升匹配质量;最终输出与原始gps轨迹对应的道路序列。
11、进一步地,所述步骤s2中,元训练的主体可以分为以下几个步骤:首先,初始化模型参数,公共编码器t'和各个城市编码器ti的参数初始化为相同的数值;其次,进行元训练循环,对于每一轮元训练,从所有城市中随机选择一个源城市作为当前任务,将公共编码器t'的参数克隆到源城市编码器ti中,得到初始的城市编码器参数,在当前源城市的训练数据上使用城市编码器ti进行训练,并更新城市编码器的参数,计算当前源城市的损失函数,并记录损失值;最后,在元训练结束后进行优化,在每一轮元训练结束后,在公共编码器t'上执行梯度下降,以优化其参数,使其能够更好地适应各个城市的交通轨迹特征,通过使用各个城市的训练数据和损失函数,计算公共编码器t'的梯度,并更新公共编码器的参数。
12、进一步地,所述步骤s2中,时空编码器t’涉及特征提取和关联性建模,以生成准确的道路表征和轨迹表征,具体步骤包括:
13、所述的道路表征,采用时空嵌入模块,该模块将每个道路节点的特征进行编码,同时考虑其空间位置和时间属性,使用图注意力网络允许模型根据交通网络的拓扑结构动态地关注重要的道路节点,引入傅里叶变换则有助于模型理解和预测周期性的时间模式;
14、所述的轨迹表征,利用轨迹注意力模块建立和强化单个轨迹中不同位置之间的关联性,通过该模块识别轨迹中的关键点,并捕捉它们之间的动态关系,使用因果注意力机制确保在计算轨迹表征时,模型遵循时间顺序,避免未来信息对过去状态的干扰,生成符合时间因果关系的轨迹序列表征。
15、进一步地,建立trajencoder,即车辆的轨迹时空编码器t,所述编码器是一种结合了图神经网络gnn和transformer的轨迹编码器,trajencoder的具体实现涉及特征提取和关联性建模,以生成准确的道路表征和轨迹表征;
16、其中,所述的道路表征模块主要应用了图神经网络gnn:时空嵌入模块用于将每个节点的特征进行编码,并通过语义感知的图注意力网络和傅里叶变换将时间信息融入其中,从而有效地嵌入交通轨迹的时空语义;
17、对节点特征,包括路段长度、路段宽度、最大限速、车道数、道路类型、gps坐标,以及边在内的道路语义进行建模,用图注意力网络gat对所述节点特征及其相邻关系进行编码,设r={rk|k∈[n]}为节点集,a∈rn×n表示它们的邻接矩阵,其中n表示道路的数量,rk表示集合中的第k条道路。定义一个轨迹为s={xi|i∈[t]},其中xi=(ri,ti),ri表示轨迹中的第i条道路,ti表示位置i的时间戳,t表示轨迹的长度,具体来说,对于每个ri,ri和由于连续性,ri+1=1,轨迹中的道路ri由图编码器表征,首先,每条道路ri被嵌入到一个稠密的向量中,作为第一层的表征,其中是轨迹中第i个位置xi的表征,它是通过mlp模型转换得到的:
18、
19、利用多头注意力机制和多层来聚合来自邻近道路的消息,从l-1层得到节点ri在l层的表征如下,其中是图注意力网络对轨迹中第i条道路在第l层的表征:
20、
21、其中,c表示头的个数,ai表示道路ri的邻居,表示头c处节点i和节点j的注意力系数,wc表示头c处的加权矩阵,表示图注意力网络对轨迹中第j条道路在第l-1层的表征;
22、对于时间戳ti,目标是获得一个从时域到d维向量空间的连续函数映射,在时间编码器中采用傅里叶变换,有限的参数可以近似地表达强大的表征空间,表征通过傅里叶变换将时间戳ti映射到一个d维向量空间,从而捕捉时间上的周期性和趋势信息:
23、
24、其中,傅里叶变换通过正弦和余弦函数的线性组合来表示时间上的周期模式,ωl和ωd表示频率范围,ωl表示最低频率,ωd表示最高频率,轨迹时空编码器的轨迹表征模块主要涉及trans:轨迹注意力模块用于建立单个轨迹中各个位置之间的关联性,通过因果注意力机制计算整个轨迹序列的表征;
25、为了封装整个交通轨迹序列的关系,利用transformer来捕获相关语义,只利用其解码器来表征和生成轨迹,其中使用多头因果注意力机制来掩盖未来点对历史点的影响,首先,将上述图编码器和时间编码器得到的嵌入串接起来,作为transformer中roadri的原始嵌入;
26、提供轨迹中每个点位置的模型信息的位置编码,并与连接作为transformer的输入;
27、将输入嵌入与三个矩阵相乘,分别创建查询q、键k和值向量v,ri的查询向量与ri及其历史点的key向量执行点积,得出注意力分数,并通过softmax操作进行归一化,直到第i个位置为止的每个点的值向量与归一化的注意力得分相乘,并将加权的值向量相加,得到该位置的自注意力表征表征:
28、
29、其中,zi表示结点ri的transformer编码器的自注意力表征,c′表示注意力头的数量,表征结点ri和rj在结点c′处的注意力系数,vij表征结点ri和rj的值向量,wo为输出矩阵;
30、当前层的表征加上前一层的隐藏表征,执行两次layernorm(ln)和一次feed-forward network(ffn),得到当前层的最终隐藏表征,因此,l层的表征可以从l-1层得到如下:
31、
32、其中,表示第l层的transformer编码器的隐藏表征,表示第l-1层的transformer编码器的隐藏表征,表示第l层的自注意力表征。
33、进一步地,所述步骤s3中,源模型的共享参数从当前元模型初始化,,源模型t’首先进行元克隆,步骤如下:
34、对每个源城市模型,从当前元模型克隆共享参数,得到源城市模型的参数θsrc,通过步骤s2所述的trajencoder使用源城市训练数据优化源城市模型参数,进行内部更新,使用源城市测试数据计算元梯度,更新元模型的参数θmeta;
35、针对每个城市进行训练,目标城市模型从更新后的元模型克隆共享参数,得到目标城市模型的参数θtgt,使用目标城市训练数据优化目标城市模型参数,进行内部更新,重复执行步骤s1-s2,对于每个源城市,使用该城市的轨迹数据进行训练,得到所对应的轨迹编码器模型ti,训练过程中采用定义的损失函数:
36、
37、其中,m表示训练数据集中轨迹的总数量,t表示每个轨迹中位置的总数量,m表示轨迹的索引,用于遍历所有轨迹,t表示轨迹中位置的索引,用于遍历每个轨迹中的所有位置,表示第m条轨迹在时间步t+1的真实标签,即真实下一跳位置,表示模型在第m条轨迹在时间步t处对时间步t+1的预测结果,即预测下一跳位置的概率分布。
38、使用已迁移好的轨迹编码器模型ttarget对其他城市进行轨迹预测,使用目标城市的轨迹数据对模型进行测试和评估,得到其在目标城市上的性能表现,将源城市上训练好的模型的知识迁移到目标城市上,利用源城市的经验来提升目标城市的轨迹预测性能,以减少目标城市数据不足的问题,并充分利用源城市的数据和知识,加速目标城市模型的训练和优化过程。
39、进一步地,所述步骤s4中,下一跳的道路ri+1与当前道路ri相邻,,以保证交通轨迹的连续性,目的地道路rt对于确定下一条道路ri+1有重要意义,提供了出行意向,避免偏离多条相邻道路ri,采用batchnorm对各层输入进行归一化,以增强模型的能力,利用sigmoid函数来计算下一个道路预测的时空门
40、
41、其中,表示结点ri的时空门控机制的计算结果,dist、bn、σ分别为距离函数、batchnorm和sigmoid函数;
42、对transformer的隐藏表征应用一个线性层来获得原始的预测logits,并进一步用时空门激活它们以获得最终的预测logits:
43、
44、其中,表示下一跳位置的概率分布,mask表示掩码机制,用于确保预测结果只包含与当前道路相邻的候选道路,linear表示线性层,用于将transformer编码器的隐藏状态转换成原始的预测logits。
45、轨迹预测完成后用matplotlib可视化工具,将结果进行可视化展示,以使隐藏特征被发觉,进一步的根据结果的分析,更新校正车辆轨迹预测模型。
46、一种时空门机制迁移的异源城市出租车轨迹生成系统,该系统包括:
47、时序数据处理模块:用于对异源城市出租车轨迹数据进行处理和清洗;
48、节点特征提取模块:用于将t’从处理后的轨迹数据中提取道路节点的特征,构建城市的道路网络;
49、模型训练模块:利用提取的节点特征进行模型训练,使用transformer深度学习算法;
50、节点预测执行模块:用于将训练好的模型进行节点预测,根据当前节点预测下一跳的节点;
51、预测结果优化模块:用于对预测结果进行优化,确保轨迹的连续性和准确性;
52、梯度更新模块:用于对maml方法进行模型的评估和迁移,迁移异源城市到目标城市的轨迹数据。
53、本发明的有益效果是:通过迁移学习和其他先进技术,提高模型在稀疏数据上的学习效果,从而生成更高质量的交通轨迹数据,为交通规划和管理提供更为丰富的数据支持。
本文地址:https://www.jishuxx.com/zhuanli/20240905/288479.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表