基于累积局部总效应图的乘客忠诚度影响机理解析方法
- 国知局
- 2025-01-10 13:31:21
本发明涉及数据分析,具体而言,尤其涉及一种基于累积局部总效应图的乘客忠诚度影响机理解析方法。
背景技术:
1、城市公共交通服务质量评价涉及多个关键维度,如线网站点布局、车辆运行状况、乘车环境、服务态度及票价政策,这些要素的服务质量直接决定了乘客的出行体验与满意度,并深刻影响着乘客对公共交通的忠诚度。高忠诚度不仅体现了乘客对公共交通服务的高度认可和持续选择,还为公共交通系统构建了稳定、可靠的客流基础,为其长期运营和发展提供了有力保障。
2、值得注意的是,公共交通服务要素的质量与乘客忠诚度之间的关系并非简单的线性对应,而是呈现出复杂的非线性特征。即某一服务要素质量的轻微变动,都可能引发乘客忠诚度的显著波动。因此,深入探究城市公共交通服务中各维度要素的服务质量如何影响乘客的公共交通忠诚度,兼具重要的理论和现实意义。在理论层面,这一研究有助于揭示公共交通服务质量与乘客忠诚度之间的内在作用机理,进一步丰富和完善公共交通服务管理的理论体系;在实践层面,该研究能为公共交通服务提供者提供科学的决策依据,指导其优化服务流程、提升服务质量,从而有效增强乘客的公共交通忠诚度,推动公共交通系统的可持续发展。
3、在探讨公共交通服务要素质量与乘客忠诚度之间的非线性关系时,梯度提升决策树、随机森林等机器学习方法发挥了关键作用。这些方法不仅能处理复杂的非线性数据关系,还能通过其内部机制揭示不同服务要素对乘客忠诚度的影响程度。同时,部分依赖图(partial dependence plot)和累积局部效应图(accumulated local effects plot)等独立于模型的解释方法也被广泛应用于可视化解析这些关系,为公共交通服务提供者提供直观的决策支持。
4、部分依赖图作为一种直观的可视化工具,能够展示一个或两个特征如何影响机器学习模型的预测结果,其优点在于直观易懂、适用多种模型,并能揭示特征与预测结果之间的线性和非线性关系。然而,当公共交通服务要素的质量特征之间存在强相关性时,部分依赖图可能无法准确反映这些要素对乘客忠诚度的独立影响,因为它假设计算部分依赖的特征与其他特征不相关,这在实际应用中往往不成立。
5、相比之下,累积局部效应图是一种能够量化解释变量对模型响应变量平均影响的可视化工具,其优点在于能在量化影响的同时解决特征之间的相关性问题,并且也是一种模型无关的解释方法。但累积局部效应图的不足在于未直接考虑解释变量的值分布对结果的影响,这可能导致忽视数据稀疏区域、无法准确反映全局效应、难以解释极端值的影响以及可能给出误导性结论,同时也限制了其作为模型解释工具的完整性。
技术实现思路
1、根据上述提出的技术问题,而提供一种基于累积局部总效应图的乘客忠诚度影响机理解析方法。本发明在继承累积局部效应图能够处理强相关性变量优势的基础上,进一步创新性地融入了每个解释变量的样本得分值分布考量,从而能够更精确、更全面地描绘公共交通服务要素质量与乘客忠诚度之间的实际关系。
2、本发明采用的技术手段如下:
3、一种基于累积局部总效应图的乘客忠诚度影响机理解析方法,包括:
4、s1、收集多维度的公共交通服务要素质量和乘客忠诚度数据;
5、s2、检验s1中数据的信度和效度,并研究公共交通服务要素质量属性之间的相关性;
6、s3、对数据进行预处理,基于乘客忠诚度测量模型计算乘客忠诚度得分,构建公共交通服务要素质量与乘客忠诚度之间的因果解析模型,捕捉服务要素质量与乘客忠诚度之间的关系,并利用数据对模型进行训练;
7、s4、利用累积局部总效应分析公共交通服务中的各个维度要素的服务质量对乘客忠诚度的影响。
8、进一步地,所述步骤s1具体包括:
9、所述乘客忠诚度表示乘客根据其以往的出行经验,在未来选择公共交通出行的持续意愿,将乘客忠诚度用显变量进行量化分析,包括:未来将继续使用公共交通出行、公共交通出行仍为首选出行方式、愿意向他人推荐公共交通服务,以及即使具备购车能力,公共交通仍为首选出行方式;
10、所述公共交通服务要素质量包括乘客交通相关技术属性感知服务质量和乘客舒适性与安全性感知服务质量两个方面,所述乘客交通相关技术属性感知服务质量表示乘客感知的用于满足其基本需求的服务要素的质量,包括:公共交通服务时间、换乘便利性、乘客往返站点的步行距离以及乘客在站点的候车时间;所述乘客舒适性和安全性的感知服务质量表示乘客感知的与运输舒适性和安全性相关的服务质量,包括:站点设施布置和候车环境、站点卫生条件、运行平稳性、车内的温度、座椅的舒适性以及安全性。
11、进一步地,所述信度用于检验数据的内部一致性,采用克朗巴赫系数检验s1中乘客忠诚度数据的信度,当计算出的克朗巴赫系数大于0.7时,表明乘客忠诚度的数据具有可靠性;
12、所述效度用于检测每个结构下的显变量是否能够反映乘客忠诚度所表示的内容,所述效度在检验的过程中,分别计算显变量的kmo统计量、bartlett球形检验的显著性概率、平均方差提取量和组合信度值,当计算结果都处在预设范围内,且因子载荷大于0.5时,表明乘客忠诚度的数据具有效度。
13、进一步地,所述相关性分析用于衡量公共交通服务要素质量中两个不同变量之间的相关性程度,当变量之间的相关性系数大于0.7时,表明变量间存在很强的相关性;当相关性系数在0.4到0.7之间时,表明变量间相关性较强;小于0.4则表明相关性较弱;
14、通过相关性的计算结果验证公共交通服务要素质量中变量之间的正相关性。
15、进一步地,所述步骤s3具体包括:
16、所述预处理,用于对收集到的数据进行清洗、整理和处理;
17、所述乘客忠诚度测量模型构建乘客忠诚度与对应的显变量的测量模型,并基于路径系数计算乘客忠诚度得分;
18、所述公共交通服务要素质量与乘客忠诚度之间的因果解析模型,将公共交通服务要素质量作为输入,将乘客忠诚度得分作为输出,在模型训练的过程中采用网格搜索法和交叉验证法对参数进行调优操作,并利用平均绝对百分比误差对模型的预测结果进行评估。
19、进一步地,步骤s4具体包括:
20、s41、计算公共交通服务要素质量中的变量在第k个区间对乘客忠诚度产生的平均局部效应:
21、k=1,2,3,4,…k其中,xs代表当前选定的部分依赖的公共交通服务要素质量变量;xc代表除xs外其他解释变量构成的向量;将公共交通服务要素质量变量的取值范围划分为一系列区间,k表示区间数量;zk+1表示第k+1个区间的下界取值,第k个区间的上界取值;表示位于第k个区间内的数据样本集合,表示数据样本集合内的样本数量;i代表中的第i个数据样本,代表集合中第i个数据样本的其他解释变量xc的得分情况;代表集合中第i个数据样本的部分依赖变量xs的替代得分,令为可微函数,用于表示机器学习模型,机器学习模型的输入为公共交通服务中各维度要素的服务质量,输出为乘客的忠诚度;x表示公共交通服务中各维度要素的服务质量构成的向量;表示xs在第k个区间对乘客的忠诚度产生的平均局部影响;
22、s42、计算xs对响应变量产生的累积局部总效应,即计算每个数据样本的累积局部效应,以区间为单位进行累积,形成累积局部总效应:
23、
24、s43、将s42中的累积局部效应进行标准化,显示每个区间内xs对响应变量产生的累积局部总效应的比例:
25、
26、其中,表示部分依赖变量xs对响应变量产生的非标准化的累积局部总效应,fxs,k,tale(x)表示对mxs,k(x)进行标准化后结果的累积百分比曲线。
27、较现有技术相比,本发明具有以下优点:
28、本发明提供的基于累积局部总效应图的乘客忠诚度影响机理解析方法,在探究乘客忠诚度影响机理的研究领域,学术界广泛采纳了多样的分析方法,这些方法既包括传统的线性回归技术,如多元线性回归、路径分析和结构方程模型,也涵盖了非线性方法,如三因素理论、梯度增强决策树和随机森林等。为了客观、准确地揭示解释变量与响应变量之间的关系,亟需一种不依赖于特定模型的分析方法。本发明提出的累积局部总效应图(tale)正是一种模型无关的解释方法,它不依赖于特定的模型类型,只需从模型中导出满足条件的可微函数,即可准确且高效地揭示变量之间的内在联系,适用于分析各类模型中解释变量与响应变量之间的关系形式。此外,相较于部分依赖图(pdp)等方法,累积局部总效应图(tale)继承了累积局部效应图(ale)的优势,能有效解决变量间的相关性问题,从而更准确地描述变量间的独立影响。
29、本发明提供的基于累积局部总效应图的乘客忠诚度影响机理解析方法,采用的累积局部总效应图(tale)在处理具有不均匀得分分布的数据样本时展现出显著优势,能够精确地揭示解释变量与响应变量之间的真实关系。在乘客忠诚度影响机理的研究中,累积局部总效应图(tale)在数据处理方面采用了标准化处理,以反映每个区间内解释变量对响应变量产生的累积局部总效应的比例。相比之下,累积局部效应图(ale)则通过中心化来计算累积局部效应,这一过程是通过将每个特征值减去其均值来实现的,使得处理后的数据均值为零。然而,这种中心化处理削弱了原始数据中的尺度信息和极端值的影响,这对于全面理解乘客忠诚度的影响机理可能构成障碍。实际上,乘客忠诚度的样本得分分布对最终交通政策的制定具有较大影响。相比之下,采用标准化处理的tale方法显示出独特的优势。标准化处理不仅保持了数据在不同特征间的相对尺度信息,还允许极端值的存在,从而能够更准确地反映乘客忠诚度的复杂动态。因此,在乘客忠诚度影响机理的研究中,标准化处理的tale方法能够更好地保留和解析数据中的细微差别和极端情况,更全面地考虑乘客行为的多样性和差异性,具有较强的适用性和解释力。
30、本发明提供的基于累积局部总效应图的乘客忠诚度影响机理解析方法,以更加客观、深入的视角揭示城市公共交通服务中各个维度要素的服务质量如何以非线性方式影响乘客的公共交通忠诚度。该方法不仅保留了传统累积局部效应图在处理强相关性变量方面的优势,还创新性地融入了每个解释变量的样本得分值分布考量。这一创新解决了传统方法因未直接考虑解释变量特征值分布对结果的影响而带来的一系列问题,包括可能忽视数据稀疏区域、无法准确反映全局效应、难以解释极端值的影响,以及可能给出误导性结论等。这不仅提升了模型作为解释工具的完整性,还能够更精确、更全面地描绘解释变量与响应变量之间的实际因果关系。通过将此方法应用于乘客忠诚度影响机理的深入分析中,本发明不仅能够独立于所使用的影响机理分析模型,探索并客观地揭示各个公共交通服务要素的感知服务质量与乘客忠诚度之间的本质关系,还为公共交通服务质量优化策略的制定提供了更为坚实的科学依据。
31、基于上述理由本发明可在数据分析等领域广泛推广。
本文地址:https://www.jishuxx.com/zhuanli/20250110/353667.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。