一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于时间序列的交通客流量预测方法

2022-07-02 14:03:16 来源:中国专利 TAG:


1.本发明涉及一种制备方法,具体涉及一种提高航站楼业务运作以及资源的合理分配,精准的预估出航站楼内旅客人数的变化情况;影响因素及数据分析的基于时间序列的交通客流量预测方法。


背景技术:

2.在智慧机场的建造过程中,提高出行旅客的满意度作为其重点的基础工作,机场自身可以通过提高航站楼的服务水平来帮助旅客在值机、安检、候机、登机等全流程中实现切实的智能化服务,使旅客感受到导航式的方便快捷,从而提高机场自身的运营效率和行业核心竞争力。其实,机场航站楼服务水平的好坏直接影响到旅客的出行满意度,也是旅客出行满意度的重要评价标准。
3.在航站楼内,基于有效的短时段的离港客流量的变化趋势的预测,按需开放值机柜台和安检口的资源数量,合理配置航站楼内外服务和安保人员,降低因旅客排队或机场服务欠缺所导致的航班延误以及突发事件产生的可能性,这样才能真正地提高出行旅客的满意度和机场的运行效率,更好地增强机场自身的核心竞争力,不被行业内所淘汰。


技术实现要素:

4.针对上述问题,本发明的主要目的在于提供一种提高航站楼业务运作以及资源的合理分配,精准的预估出航站楼内旅客人数的变化情况;影响因素及数据分析的基于时间序列的交通客流量预测方法。
5.本发明是通过下述技术方案来解决上述技术问题的:一种基于时间序列的交通客流量预测方法,所述基于时间序列的交通客流量预测方法包括如下步骤:
6.步骤一:对航班数据、值机数据、行李信息、旅客基础信息等源数据进行数据抽取与重构的基础上,从值机方式分布、航班分布、值机旅客人数分布、客座率、旅客出行特点、航班延误进行数理统计,挖掘出影响客流量变化的原因;
7.步骤二:在预测模型建立过程中依据不同的值机方式进行数据分类分别进行客流量预测;同时,接下来的分析将按照不同的值机方式作为基础进行分类统计;在一个航班计划表内很难寻到到明显的dow特性,需要对航班dow(day of week函数,星期几)特性进行更仔细的数据分析;
8.步骤三:首先,按照星期,将一周内每天的航班数以每六十分钟为一时段求每时段内的平均航班数量,其中x轴为时间,y轴为各时段内的航班数;
9.注:航班数量为离港时间处在相应时间段内的航班数量;
10.然后,依旧按照星期将一周内每天的航班数以每六十分钟为一时段求每时段内的航班数量的汇总,所得到的数据加上实验分析航班离港时间、飞行频次、是否工作日发现影响值机客流量的因素;
11.步骤四:arima模型是由博克思和詹金斯这两位学者提出的有关于时间序列的预
测方法,被称为box-jenkins模型。其基本思想是:将预测对象的数据序列用数学模型来近似描述出来,并且对其进行参数识别;最后,被确定下来的模型就可以从时间序列的过去值及现在值来进行未来值的预测。
12.步骤二的具体过程为:
13.1)、由于选择不同值机方式的人数相差较大以及每种值机方式的办理时间不同,所以,在预测模型建立过程中要依据不同的值机方式进行数据分类分别进行客流量预测;同时,接下来的分析将按照不同的值机方式作为基础进行分类统计;
14.2)、在一个航班计划表内很难寻到到明显的dow特性,需要对航班dow特性进行更仔细的数据分析;接下来,基于机场内每个航空公司有固定的值机区域,以选择人工柜台值机为例,值机区域可以分为值机岛f、值机岛g以及值机岛h;按照星期和不同的值机岛进行数据分类,分别统计在一周内每个值机岛每天的航班数量变化,以每六十分钟为一时段来统计每时段内的航班数量。
15.在本发明的具体实施例子中,步骤四的具体过程为:arima模型以原序列的平稳性和回归过程中的不同作为分类标准,包括ma过程、ar过程、arma过程、arima过程;arima(p,d,q)的被称为差分自回归移动平均模型,含有自回归ar,自回归项p,移动平均ma,移动平均项数q,以及差分次数d。
16.在本发明的具体实施例子中,建立arima(p,d,q)的模型首先需要将时间序列从非平稳状态转化为平稳状态,然后仅对因变量的滞后值、随机误差项的现值和滞后值进行回归,最终得到预测模型:
[0017][0018]
其中l是滞后算子,d∈z;d>0。
[0019]
在本发明的具体实施例子中,某些时间序列中,有时会存在明显的周期性或者季节性的变化,这类序列称为季节性序列;
[0020]
建立季节性或周期性时间序sarima模型,即arima(p,d,q)
×
(p,d,q)s;其中,p,q,p,q表示季节自回归,季节性的移动平均算子的最大滞后阶数、非季节自回归、非季节性的移动平均算子的最大滞后阶数,d,d分别表示非季节性的差分次数以及季节性的差分次数,s表示时序的变化周期;
[0021]
首先,变化周期s是指时间间隔为s的时序值之间具有相同的变化规律;为使数据更加具有代表性,需要利用季节差分的方法来消除其周期性变化;差分算子的普遍定义是δs=1-ls;假设用y
t
表示季节性的时间序列,那么一次季节差分则可以表示为:
[0022]
δ
syt
=(1-ls)y
t
=y
t-y
t-s
[0023]
当时间序列为非平稳状态时,需要对变化周期s进行d次季节差分,这样才能完成平稳序列的转化;d不会大于1,p和q不会大于3;
[0024]
接下来,在u
t
是平稳的、非自相关的基础上,建立基于s周期的sarima模型:如果u
t
为非平稳状态且存在arma成分时u
t
可以表示为:即其中v
t
代表的是白噪声过程;
[0025]
最后,把上述公式代入,得到季节时间序列模型即(p,d,q)
×
(p,d,q)s阶乘季节性
模型:
[0026]
应对y
t
检验平稳性:
[0027]
第一,基于响应序列和输入序列来建立回归模型:
[0028]yt
=β0 β1x
1t


βkx
kt
ε
t
[0029]
其中,β0,β1…
βk表示最小二乘估值,ε
t
对回归残差序列;
[0030]
第二,对回归残差序列ε
t
引进行平稳性检验;然后,进行回归模型的残差序列的判定;假设(y
t
)和(x
1t
)...(x
kt
)都为平稳序列,而且它们的线性组合也是平稳序列,则认为残差序列{ε
t
}是平稳的;接下来,检验模型是否具有延迟变量;这是因为回归模型不仅可以是y
t
关于x
it
(i=1,2,3...,k)的回归,也可以是关于x
it
(i=1,2,3...,k)的延迟变量的回归;最后得到:
[0031][0032][0033]
其中,α
t
为零均值白噪声序列;代表输入变量的第i个ar系数多项式;φi(b)代表输入变量的第i个ma系数多项式;li代表第z个输入变量的延迟阶数;ε
t
代表回归残差序列。
[0034]
在本发明的具体实施例子中,以值机旅客人数(y
t
)为响应变量序列,航班数据(x
t
)为输入变量序列;在响应序列(y
t
)的时间序列平稳的基础上,将输入变量序列(x
t
)作为协变量加入到时间序列中建立arimax模型;其中,选择历史数据时将采用dow的策略;例如,预测第n天,需要利用n-7,n-14,...,n-7m(其中m=1,2,3,...)天的历史数据;
[0035]
第一步,时间序列必须满足方差齐性要求,需要对时间序列(y
t
)进行平稳性分析;第二步,计算(y
t
)和(x
t
)的互相关系数并验证互相关性;需要将(y
t
)和(x
t
)从各自的自相关关系中剥离出来,对(y
t
)和(x
t
)的互相关系数进行预白化处理;这主要用于判断响应序列(y
t
)和输入变量序列(x
t
)是否为伪相关;相关的基础上,进一步研究(y
t
)和(x
t
)之间的ccf;第三步,在arimax模型中,若不满足平稳性,就容易产生虚假回归问题;利用协整理论对(y
t
)和(x
t
)进行协整检验;第四步,为了确定应将协变量的哪些滞后项纳入模型中,需要考察预白化数据的样本互相关图来找寻依据,进而初步将(y
t
)拟合成对于(x
t
)序列的带有误差的回归模型;第五步,进行模型检验;若该模型各项系数显著且通过各种模型诊断性检验,则得到动态回归的arimax模型。
[0036]
本发明的积极进步效果在于:本发明提供的基于时间序列的交通客流量预测方法,该方法提高航站楼业务运作以及资源的合理分配,精准的预估出航站楼内旅客人数的变化情况;影响因素及数据分析。在源数据己完成抽取、重构和数据预处理后,从值机方式分布、航班分布、值机旅客人数分布、客座率、旅客出行特点等方面进行数理统计和影响因素的相关分析。最后,基于数据分析的结果,发现时间序列中潜在的变化规律和主要的影响因子,找出能够提高预测精度的关键因素;在客流量的潜在变化规律分析过程中,发现时序变化规律呈现出高度的特征相似性,比如非线性、周期性以及不确定性等;以短时段每小时的值机客流量为研究对象,在dow特性的基础上运用分类和协整理论进行时间序列的构建
和依赖性分析,提出了带有输入变量的动态回归的arimax模型,来预测航站楼内短时段的值机客流量的人数情况。
附图说明
[0037]
图1为本发明的整体结构示意图。
具体实施方式
[0038]
下面结合附图给出本发明较佳实施例,以详细说明本发明的技术方案。
[0039]
图1为本发明的整体结构示意图,如图1所示:本发明提供的一种基于时间序列的交通客流量预测方法。
[0040]
本发明的基于时间序列的交通客流量预测方法包含以下步骤:
[0041]
步骤一:提高航站楼业务运作以及资源的合理分配,精准的预估出航站楼内旅客人数的变化情况。
[0042]
机场客流量是指单位时间内进入航站楼的值机旅客人数。在研究目标上,可以分为短时段客流量预测和机场吞吐量预测。它们的普遍特点是,在时间分布上很不均衡,又呈现出一定规律性。在掌握实时的客流量变化后,对其分析,可预测短期内客流量的增长变化趋势以及流量大小。
[0043]
从而,它可以解决航站楼内某些区域因客流量过多导致的旅客拥堵以及突发事件产生的问题,航站楼内整体达到客流量的上限而未知的状况,还有因不能掌握客流变化而无法及时做出的事故预警和应急措施的问题。
[0044]
时间序列是指在时刻点t1,t2,

,tn上按照时间的先后顺序进行排序所得到的一组变量值x(t),即x(t)=x
t1
,x
t2
,...,x
in
。它主要可以体现出时间序列的长期变化趋势、季节性的趋势变动、循环性的变动和不规则的随机变动等。
[0045]
时间序列分析是一种动态数据处理的统计方法。其主要目的是根据己有的历史数据对未来进行预测。它基于随机过程和数理统计学的理论方法,一般采用曲线拟合和参数估计的方法来建立相应的数学模型,从而研究时间序列所遵从的潜在变化规律,用来解决具体的实际应用问题。
[0046]
步骤二:影响因素及数据分析。在源数据己完成抽取、重构和数据预处理后,从值机方式分布、航班分布、值机旅客人数分布、客座率、旅客出行特点等方面进行数理统计和影响因素的相关分析。最后,基于数据分析的结果,发现时间序列中潜在的变化规律和主要的影响因子,找出能够提高预测精度的关键因素。
[0047]
在对航班数据、值机数据、行李信息、旅客基础信息等源数据进行数据抽取与重构的基础上,从值机方式分布、航班分布、值机旅客人数分布、客座率、旅客出
[0048]
行特点、航班延误等多个方面进行数理统计,挖掘出影响客流量变化的主要原因。
[0049]
步骤三:在客流量的潜在变化规律分析过程中,发现时序变化规律呈现出高度的特征相似性,比如非线性、周期性以及不确定性等。
[0050]
由于选择不同值机方式的人数相差较大以及每种值机方式的办理时间不同,所以,在预测模型建立过程中要依据不同的值机方式进行数据分类分别进行客流量预测。同时,接下来的分析将按照不同的值机方式作为基础进行分类统计。
[0051]
在一个航班计划表内很难寻到到明显的dow特性,需要对航班的dow特性进行更仔细的数据分析。
[0052]
首先,按照星期将一周内每天的航班数以每六十分钟为一时段求每时段内的平均航班数量,其中x轴为时间,y轴为各时段内的航班数。注:航班数量为离港时间处在相应时间段内的航班数量。
[0053]
然后,依旧按照星期将一周内每天的航班数以每六十分钟为一时段求每时段内的航班数量的汇总。
[0054]
接下来,基于机场内每个航空公司有固定的值机区域,以选择人工柜台值机为例,值机区域可以分为值机岛f、值机岛g以及值机岛h。按照星期和不同的值机岛进行数据分类,分别统计在一周内每个值机岛每天的航班数量变化,以每六十分钟为一时段来统计每时段内的航班数量。
[0055]
经过对航班的dow特性的研究后,接下来就是分析航班数量与旅客值机人数之间的趋势相关性。按照值机方式和值机区域的分类,将每天的航班数量曲线与值机客流量曲线进行趋势对比,以每六十分钟为一时段来统计每时段内的相关数据。
[0056]
步骤四:以短时段每小时的值机客流量为研究对象,在dow特性的基础上运用分类和协整理论进行时间序列的构建和依赖性分析,提出了带有输入变量的动态回归的arimax模型,来预测航站楼内短时段的值机客流量的人数情况。
[0057]
因此,建立arima(p,d,q)的模型首先需要将时间序列从非平稳状态转化为平稳状态,然后仅对因变量的滞后值、随机误差项的现值和滞后值进行回归,最终得到预测模型。其具体公式为:
[0058][0059]
其中l是滞后算子,d∈z;d>0。
[0060]
某些时间序列中,有时会存在明显的周期性或者季节性的变化,这类序列称为季节性序列。应该建立季节性或周期性时间序sarima模型,即节性序列。应该建立季节性或周期性时间序sarima模型,即
[0061]
其中,p,q,p,q表示季节自回归,季节性的移动平均算子的最大滞后阶数、非季节自回归、非季节性的移动平均算子的最大滞后阶数,d,d分别表示非季节性的差分次数以及季节性的差分次数,s表示时序的变化周期,v
t
代表的是白噪声过程。
[0062]
在模型识别中,阶数的判别可以基于实际分析、时间序列图、acf图、pacf图等来确定。假设acf图和pacf图没有呈现出线性的衰减趋势,却在变化周期的时间点上呈现出振荡式的较大的峰值变化,那么可以认为这是一组能用sarima模型描述的时间序列。
[0063]
协整理论:一组特定的动态方程可以对具有“共整合性”的多个时间序列变量之间的长期均衡的动态关系进行重新表述,并且,这组动态方程使得时间序列分析更有效。第一,基于响应序列和输入序列来建立回归模型:
[0064]yt
=β0 β1x
1t


βkx
kt
ε
t
[0065]
其中,β0,β1…
βk表示最小二乘估值,ε
t
对回归残差序列。第二,对回归残差序列ε
t
引进行平稳性检验。
[0066]
建立arimax模型,首先,构建响应序列和输入变量序列的回归模型;然后,进行回
归模型的残差序列的判定;接下来,检验模型是否具有延迟变量;最后,使用arma模型继续提供残差序列中的相关信息。
[0067][0068][0069]
其中,α
t
为零均值白噪声序列;代表输入变量的第i个ar系数多项式;φi(b)代表输入变量的第i个ma系数多项式;li代表第z个输入变量的延迟阶数;ε
t
代表回归残差序列。
[0070]
平稳性和预白化处理,实验中,一般采用adf单位根检验来检测时间序列的平稳性。预白化处理指对数据进行平稳化处理,然后把与处理后的序列相拟合的ar模型作为滤波器应用于两个差分后的序列。
[0071]
协整检验,第一步,用ols方法估计方程并计算非均衡误差;第二步,检验的单整性。若为稳定序列,则认为具有协整关系。
[0072]yt
=β0 β1x
t
e
t
[0073][0074][0075]
在序列的线性组合为平稳且{y
t
}和{x
t
}之间存在着强相关关系的基础上,若检测残差序列为平稳序列,则对比样本残差的自相关函数acf、偏相关函数pacf图和eacf图来识别模型阶数。经过回归比较、模型参数调整、异常值的检测等进一步识别模型参数,构建响应序列和输入变量序列的回归模型,若各项系数不显著,则继续调整模型参数。
[0076]
以值机旅客人数(y
t
)为响应变量序列,航班数据(x
t
)为输入变量序列。在响应序列(y
t
)的时间序列平稳的基础上,将输入变量序列(x
t
)作为协变量加入到时间序列中建立arimax模型。其中,选择历史数据时将采用dow的策略。例如,预测第n天,需要利用n-7,n-14,...,n-7m(其中m=1,2,3,...)天的历史数据。
[0077]
首先,时间序列必须满足方差齐性要求,需要对时间序列(y
t
)进行平稳性分析。第二步,计算(y
t
)和(x
t
)的互相关系数并验证互相关性。需要将(y
t
)和(x
t
)从各自的自相关关系中剥离出来,对其进行预白化处理。这主要用于判断响应序列(y
t
)和输入变量序列(x
t
)是否为伪相关。相关的基础上,进一步研究(y
t
)和(x
t
)之间的ccf。第三步,在arimax模型中,若不满足平稳性,就容易产生虚假回归问题。利用协整理论对(y
t
)和(x
t
)进行协整检验。第四步,为了确定应将协变量的哪些滞后项纳入模型中,需要考察预白化数据的样本互相关图来找寻依据,进而初步将(y
t
)拟合成对于(x
t
)序列的带有误差的回归模型。最后,进行模型检验。若该模型各项系数显著且通过各种模型诊断性检验,则得到动态回归的arimax模型。
[0078]
以上显示和描述了本发明的基本原理和主要特征和本发明的优点。本行业的技术人员应该了解,本发明不受上述实施例的限制,上述实施例和说明书中描述的只是说明本发明的原理,在不脱离本发明精神和范围的前提下,本发明还会有各种变化和改进,这些变化和改进都落入要求保护的本发明范围内,本发明要求保护范围由所附的权利要求书及其等效物界定。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献