一种K-means&BP神经网络的高速小客车出行特征群体辨识方法与流程
- 国知局
- 2024-10-21 15:01:42
本发明涉及大数据和人工智能,特别是涉及一种k-means&bp神经网络的高速小客车出行特征群体辨识方法。
背景技术:
1、近年来,随着我国高速公路的快速发展,大数据技术和人工智能逐渐被应用于高速公路的相关设施和交通管制上,例如电子不停车收费系统、交通事件识别、轨迹分析、车牌识别等。其中,高速公路电子不停车收费系统(etc)作为目前高速公路上常用的收费方式,不仅能够缩短高速公路收费时间,还节约了人工成本,更能结合大数据获取通过高速收费站的车辆具体信息,是利于出行人员出行和交通管理者管理的高新技术。
2、然而,正是高速公路上服务质量的提高,使得高速公路上的出行行为变得多样化,但传统的管理和服务手段无法识别出不同的出行群体,只能将其视为同一个体,从而根据特定的出行特征提供特定的服务方式,缺乏对相似群体的准确辨识。此外,对于高速公路上etc数据的利用率也普遍偏低,更多用于交通管理方面,例如交通拥堵预警、违章行为监控、事故快速处理等,缺乏利用etc数据对于车辆出行信息的一种探索应用,导致缺少对这一方面etc数据分析与特征挖掘的方法,etc数据所包含的价值未能充分发挥其应有的作用,etc系统的优势也得不到全方位的体现。
技术实现思路
1、针对上述现有技术的不足,本专利申请所要解决的技术问题是如何提供一种k-means&bp神经网络的高速小客车出行特征群体辨识方法,利用高速公路上大量的etc数据,通过数据预处理、python提取指标、canopy-k-means聚类、蚁群算法及bp神经网络学习等流程,构建出行特征群体分类和识别模型,并评价模型对出行特征群体识别的效果,进而实现对高速公路上出行特征群体的准确识别。
2、为了解决上述技术问题,本发明采用了如下的技术方案:
3、一种k-means&bp神经网络的高速小客车出行特征群体辨识方法,对高速公路上etc车辆数据进行收集并进行数据处理与建模分析,识别高速上小客车出行的特征群体,具体包括以下步骤:
4、s1:对已收集的etc数据进行预处理;s2:提取小客车出行特征指标;s3:通过canopy预聚类算法、k-means聚类算法和蚁群算法相结合的混合聚类算法对用户特征群体进行分类;s4:设置神经网络层数、隐藏层神经元个数、期望误差、学习率、动量因子、节点激活函数参数;s5:以小客车出行特征指标数据作为模型输入,构建bp神经网络模型,包括训练模型和测试模型;s6:通过测试模型对模型的精确率、召回率、准确率指标进行计算,并评价模型的识别效果;s7:得到识别出行特征群体的模型,识别出行特征群体。
5、具体的,步骤s1中,利用python对已收集的etc数据进行预处理,包括缺失值处理、重复值处理、异常值处理以及数据关联;
6、所述缺失值处理是指将有缺失的数据删除或填充,取决于缺失数据是否关键;
7、所述重复值处理是指相同的数据可能会被etc记录多次,在识别出重复或相似重复的数据后,仅保留一条数据,删除其余数据;
8、所述异常值处理是指将相对于正常数据,过高或过低的数据进行删除;
9、所述数据关联是指将通过缺失值处理、重复值处理喝异常值处理后,具有共同交易id字段信息和车牌信息的数据进行关联整合。
10、具体的,步骤s2中,所述小客车出行特征指标包括研究期间内用户出行的月出行天数、单次平均出行距离、高峰时段出行偏好和周末及节假日出行偏好;
11、所述月出行天数是指同一车辆在研究期内一个月的出行天数平均值,通过python代码来实现指标提取;
12、所述单次平均出行距离是指同一车辆在研究期间内每次出行的距离平均值,利用网络爬虫手段获取车辆路径,再通过python代码获得每次出行的行驶距离;
13、所述高峰时段出行偏好是指车辆在研究期间内选择高峰时段出行的频繁程度,通过python统计车辆在研究期间内的总出行次数和高峰出行次数,计算出高峰出行偏好系数;
14、所述周末及节假日出行偏好是指车辆在研究期间内选择周末及节假日出行的频繁程度,通过python统计车辆在研究期间内的出行总天数和选择周末及节假日出行的天数,计算出周末及节假日出行偏好系数。
15、具体的,步骤s3中,通过混合聚类算法对用户特征群体进行分类,通过canopy预聚类算法确定聚类数k与初始聚类中心,再通过k-means聚类算法不断迭代,直至聚类中心不再发生变化,得到聚类结果,最后通过蚁群算法对结果进行优化,提高算法聚类的精度。
16、具体的,步骤s5中,将提取的小客车出行特征指标作为模型的输入,构建bp神经网络训练模型,当输出结果与实际值之间的误差小于期望误差时停止训练,训练时间最快的参数组合为最佳参数组合;反之,重新设定上述参数,继续训练,直至最佳。
17、具体的,步骤s6中,将测试样本输入测试模型进行测试,并与实际的特征群体进行对比,得出最佳参数组合下出行特征群体识别模型的精确值、灵敏度和准确值,以此评价模型的识别效果。
18、综上,高速公路是连接城市之间的重要通道。现有的etc收费系统无法准确分辨出不同的出行特征群体,缺乏对不同出行特征群体的服务手段,且etc数据的用途较为单一。针对高速公路上不同类型车辆的出入,在深入了解etc系统的各项数据的基础上,本申请为了深度挖掘etc数据的用处,提出了一种基于k-means&bp神经网络的出行特征群体识别方法,对etc数据进行预处理、特征群体分类等操作,从而构建出行特征群体识别模型,得到识别特征群体的方法,便于研究高速公路上车辆的出行行为。
技术特征:1.一种k-means&bp神经网络的高速小客车出行特征群体辨识方法,其特征在于,对高速公路上etc车辆数据进行收集并进行数据处理与建模分析,识别高速上小客车出行的特征群体,具体包括以下步骤:
2.根据权利要求1所述的一种k-means&bp神经网络的高速小客车出行特征群体辨识方法,其特征在于,步骤s1中,利用python对已收集的etc数据进行预处理,包括缺失值处理、重复值处理、异常值处理以及数据关联;
3.根据权利要求2所述的一种k-means&bp神经网络的高速小客车出行特征群体辨识方法,其特征在于,步骤s2中,所述小客车出行特征指标包括研究期间内用户出行的月出行天数、单次平均出行距离、高峰时段出行偏好和周末及节假日出行偏好;
4.根据权利要求1所述的一种k-means&bp神经网络的高速小客车出行特征群体辨识方法,其特征在于,步骤s3中,通过混合聚类算法对用户特征群体进行分类,通过canopy预聚类算法确定聚类数k与初始聚类中心,再通过k-means聚类算法不断迭代,直至聚类中心不再发生变化,得到聚类结果,最后通过蚁群算法对结果进行优化,提高算法聚类的精度。
5.根据权利要求1所述的一种k-means&bp神经网络的高速小客车出行特征群体辨识方法,其特征在于,步骤s5中,将提取的小客车出行特征指标作为模型的输入,构建bp神经网络训练模型,当输出结果与实际值之间的误差小于期望误差时停止训练,训练时间最快的参数组合为最佳参数组合;反之,重新设定上述参数,继续训练,直至最佳。
6.根据权利要求1所述的一种k-means&bp神经网络的高速小客车出行特征群体辨识方法,其特征在于,步骤s6中,将测试样本输入测试模型进行测试,并与实际的特征群体进行对比,得出最佳参数组合下出行特征群体识别模型的精确值、灵敏度和准确值,以此评价模型的识别效果。
技术总结本发明公开了一种K‑means&BP神经网络的高速小客车出行特征群体辨识方法,包括以下步骤:S1:对已收集的ETC数据进行预处理;S2:提取小客车出行特征指标;S3:通过Canopy预聚类算法、K‑means聚类算法和蚁群算法相结合的混合聚类算法对用户特征群体进行分类;S4:设置神经网络层数、隐藏层神经元个数、期望误差、学习率、动量因子、节点激活函数参数;S5:以小客车出行特征指标数据作为模型输入,构建BP神经网络模型,包括训练模型和测试模型;S6:通过测试模型对模型的精确率、召回率、准确率指标进行计算,并评价模型的识别效果;S7:得到识别出行特征群体的模型,识别出行特征群体。通过本申请构建出行特征群体识别模型,便于研究高速公路上车辆的出行行为。技术研发人员:冯阳春,朱奇,张雷,穆薇宇,罗粲,杨涛,彭博,邢茹茹受保护的技术使用者:重庆通渝科技有限公司技术研发日:技术公布日:2024/10/17本文地址:https://www.jishuxx.com/zhuanli/20241021/320227.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。