一种基于多源异构数据处理的高铁网络晚点推演方法
- 国知局
- 2024-10-21 14:25:55
本发明涉及轨道列车,特别是一种基于多源异构数据处理的高铁网络晚点推演方法。
背景技术:
1、铁路网络是由众多固定设施(如车站、信号系统)和移动对象(如列车)组成的复杂系统。移动对象的运行状态是系统中设施和移动对象之间相互作用以及外部环境例如恶劣天气影响的结果。作为衡量实际运行方案与计划运行方案之间的指标,晚点通常用于评估铁路网络的状态。而列车作为铁路路网最常见的以及最重要的移动对象,网络中运行列车(running trains,rt)的晚点是一个极好的评估铁路网络状态的指标。预测铁路网络中rt的晚点,可以揭示铁路网络晚点状态演化的规律,从而帮助调度员制定更合理、科学的调度策略调整方案;还可以支撑调度员进行实时地网络状态评估,以制定合适的短期和长期决策。
2、列车晚点预测问题根据待预测的目标可以分为以列车为导向以及以网络为导向的研究。以列车为导向的研究主要针对每一列列车,并预测每列列车在前方车站的晚点。而以网络为导向的研究以高速铁路网络为研究对象,主要研究铁路网络中在不同的时间戳下的运行状态。既有的晚点预测的研究大多数以列车为导向。然而,在实际运输组织过程中,调度员通常会以系统的角度更加地关注网络状态,即铁路网络在一定时间后的晚点状态。因此,与以列车为导向的研究方法相比,以网络为导向的方法系统性更强。以网络为导向的方法将每个时刻的所有列车视为一个整体,在给定时刻下,通过预测网络中的所有列车在一定时间间隔后的晚点来探索铁路网络晚点的演化。因此,面向网络的方法更适合调度员掌握整个铁路网络的状态,并制定更加全面系统的调整策略。因此,本方案研究的主要问题为:在运输网络中的不同实体(例如,车站、列车等)相互作用下,网络在列车晚点经过一定的时间演化后呈现怎么的晚点状态。
3、虽然晚点是铁路网络中不同实体之间相互作用的结果,但并非所有列车都同时受到相同实体的影响;例如,在给定的时间戳下,铁路网络中的一些列车受到设备故障的影响,但其他列车可能没有受到该影响。因此,在晚点预测中,列车的输入特征可能不同,即输入特征不一致。既有的晚点预测研究主要基于传统的机器学习算法(如rf、svr等)和图神经网络(graph neural network,gnn)。机器学习模型通常采用矩形或网格格式的数据作为模型输入。换而言之,机器学习模型无法克服输入特征的不一致性,它们要求所有样本具有相同的输入特征,而那些具有一些缺失输入特征的样本必须人工填充。例如,没有设备故障相关特征的待预测列车需要被人为地填充一些指定值(例如,0),以确保它们与具有设施故障相关特征的列车具有相同的输入特征。这种人工填充的方式需要一些先验知识和领域知识作为支撑,而这些填充值在一定程度上也会影响最终的预测结果。
4、gnn基于边和相邻的节点更新节点信息,并且允许节点具有不同数量的相邻节点。因此,将影响因素和待预测列车视为节点,并将它们相连以捕捉影响因素对待预测的列车的影响,是解决传统机器学习研究不足的一个新思路。这样,具有特定影响因素的列车只需要与特定影响因素相连,所有的样本可以有不同的输入特征。然而,现有的基于gnn的研究只应用了同质图神经网络(homogeneous graph neural network,homognn),homognn要求gnn中的所有节点具有相同的属性;因此,这些研究无法将影响因素和待预测列车同时视为节点,他们仅能将列车视为节点,或者将其它实体对列车的影响分配为列车节点的属性。因此,如果能有一种以网络为导向且能处理输入特征不一致性的方法,则可以弥补现有铁路网络晚点演化方法的不足。
技术实现思路
1、为解决现有技术中存在的问题,本发明的目的是提供一种基于多源异构数据处理的高铁网络晚点推演方法,本发明解决了既有homognn模型无法处理不同类型的节点,以及既有机器学习模型需要矩形或网格格式的输入特征即需要每一个样本输入特征的必须一致的限制问题。
2、为实现上述目的,本发明采用的技术方案是:一种基于多源异构数据处理的高铁网络晚点推演方法,包括以下步骤:
3、步骤1、基于hetgnn异质图神经网络与graphsage同质图神经网络,结合后构建得到sage-hetgnn模型;
4、步骤2、获取高速铁路网络样本数据并构建训练集、验证集和测试集,将高速铁路网络中的实体抽象为包含不同属性的节点,并使用元路径描述节点之间的关系,构建每个时间戳下的包含多种节点类型以及多种元路径的异质图;
5、步骤3、基于所述训练集、验证集和测试集对构建的sage-hetgnn模型分别进行训练、验证并调整模型超参数和测试,得到最终的sage-hetgnn模型;
6、步骤4、基于当前时间戳下所述高速铁路网络的晚点状态,利用最终得到的sage-hetgnn模型获取所述高速铁路网络中包含的所有运行列车在经过预设时间间隔后的下一个时间戳下的晚点预测值。
7、作为本发明的进一步改进,在步骤2中,所述元路径包括rt-rr-rt、tt-tr-rt、station-ss-station和station-sr-rt;rt-rr-rt表示两个相邻rt节点之间的连接关系,反映了rt节点之间的相互作用;tt-tr-rt表示前行tt节点和后行rt节点之间的关系;station-ss-station元路径反映了铁路网的物理结构,即前方的车站影响后方的车站;station-sr-rt元路径将ps/ts节点与rt节点连接起来,表示列车与下一个车站之间的关系;其中:rt节点表示运行列车,tt节点表示终到列车,ps节点表示通过站,ts节点表示终到站。
8、作为本发明的进一步改进,在步骤2中,将高速铁路网络中的实体抽象为包含不同属性的节点包括运行列车节点、终到列车节点、通过站节点和终到站节点;其中:
9、运行列车节点的属性包括:c:待预测列车在当前时间戳的晚点;i:待预测列车与第一列前行列车之间的间隔时间;s:当列车在车站时,为待预测列车在下一个区间的计划运行时间;当列车在区间时,为待预测列车在当前区间的计划运行时间;m:当列车在车站时,为待预测列车在下一个区间的最小运行时间;当列车在区间时,为待预测列车在当前区间的最小运行时间;r:当列车在车站时,为待预测列车在下一个区间的剩余运行时间;当列车在区间时,为待预测列车在当前区间的剩余运行时间;
10、终到列车节点的属性包括:c:待预测列车在当前时间戳的晚点;
11、通过站节点的属性包括:n:车站到发线数量;
12、终到站节点的属性包括:n:对应的到发场的到发线数量。
13、作为本发明的进一步改进,所述步骤4具体如下:
14、将四种不同类型的初始节点信息映射到同一维度空间,所有的节点经过映射后得到的是256维的向量;使用四层sage神经网络对每个元路径中的节点信息进行更新,每层的神经网络均有256个神经元,相邻两层之间使用relu函数进行激活;通过使用sum聚合函数对更新后的节点信息进行聚合;最后得到当前高速铁路网络中的每个运行列车节点在下一个时间戳上的晚点预测值。
15、作为本发明的进一步改进,在步骤4中,若列车提前到达,则列车的晚点值为负值;若列车准点到达,则列车的晚点值为0;若列车晚点到达,则列车的晚点值为正值。
16、作为本发明的进一步改进,所述步骤3具体如下:
17、使用平均绝对误差mae作为损失函数来训练sage-hetgnn模型;
18、使用初始学习率为0.001的adam优化器作为模型优化器,当验证数据集在10个迭代内的损失函数下降小于0.01时,将优化器的全局学习率降低为原来的10%;为了防止模型过拟合,当验证数据集在30次迭代中损失函数减少小于0.01时,模型停止训练;为了节省训练时间与计算资源,设置最大的迭代次数为300,并且使用batchsize为64的dataloader技术。
19、作为本发明的进一步改进,还包括:
20、通过对比在剔除掉不同的元路径时sage-hetgnn模型的预测精度,从空间维度揭示不同节点之间的相互作用关系对高速铁路网络晚点状态演化的作用效果。
21、作为本发明的进一步改进,还包括:
22、通过对比不同预测时间间隔下的sage-hetgnn模型的预测精度,从时间维度验证sage-hetgnn模型在不同预测时间间隔下对高速铁路网络晚点状态的预测效果。
23、本发明的有益效果是:
24、针对铁路网络晚点演化问题,本发明综合考虑高速铁路网络中的不同种类实体之间的相互作用,结合sage同质图神经网络和hetgnn结构设计了一种新的神经网络模型sage-hetgnn模型,sage-hetgnn模型可以处理不同类型的节点,并捕获节点之间的相互作用,基于sage-hetgnn模型,可通过预测在未来时间戳时运行列车的晚点来研究铁路网络晚点演化,并具有较高的预测精度。
本文地址:https://www.jishuxx.com/zhuanli/20241021/318121.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表