一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种车辆数据提取方法、装置、设备及介质与流程

2022-06-29 18:06:34 来源:中国专利 TAG:


1.本发明涉及数据处理技术领域,特别涉及一种车辆数据提取方法、装置、设备及介质。


背景技术:

2.目前我国纯电动汽车的保有量已突破300万大关,并且依托于车联网技术的快速发展以及地方及企业车辆监控平台的逐步成熟,纯电动汽车的行驶与使用数据已形成庞大的规模体量。电动汽车一年的销售数量达数十万台,单车上的上传信号超过200个,单次上传的时间间隔为10s。如何更好的利用大数据分析用户习惯与车辆特性来指导纯电动汽车的功能开发、测试和评价是目前研发的重点。
3.但是目前面临的主要问题有:1、数据中往往存在噪声信息、干扰信息、无效信息和信息中断等,如何对其进行有效的清洗对下一步的数据的提取和分析有着重要的意义;2、如何建立基于特定业务需求的数据提取方法与算法,也是目前的难点之一。


技术实现要素:

4.本发明实施例提供一种车辆数据提取方法、装置、设备及介质,用以解决现有技术中,难以基于特定的提取需求,对车辆的数据进行有效提取的问题。
5.为了解决上述技术问题,本发明实施例提供如下技术方案:
6.本发明实施例提供一种车辆数据提取方法,包括:
7.通过用户数据自动抓取平台,获取车辆的原始数据文件;
8.通过原始数据文件分类平台,将所述原始数据文件按照预设的维度进行分类,得到分类数据文件;
9.通过数据清洗平台,对所述分类数据文件进行清洗,得到清洗数据文件;
10.通过数据提取平台,按照预先设定的数据提取需求与评判准则,将所述清洗数据文件进行提取,得到提取数据文件。
11.可选地,所述通过用户数据自动抓取平台,获取车辆的原始数据文件,包括:
12.通过所述用户数据自动抓取平台,建立与车辆用户数据平台以及软件数据库之间的连接;
13.获取所述车辆用户数据平台上的车辆的基本属性信息,将所述基本属性信息存入所述软件数据库中;
14.根据预设的基本属性信息以及预设的目标时间范围,获取所述车辆的原始数据文件。
15.可选地,所述通过原始数据文件分类平台,将所述原始数据文件按照预设的维度进行分类,得到分类数据文件,包括:
16.通过所述原始数据文件分类平台,获取所述原始数据文件中的车型信息,在所述原始数据文件中建立车型文件夹,将相同车型的原始数据文件剪切至所述车型文件夹中;
17.在所述车型文件夹中,获取所述原始数据文件中的地域信息,在所述车型文件夹中建立地域文件夹,将相同地域的原始数据文件剪切至所述地域文件夹中。
18.可选地,所述通过数据清洗平台,对所述分类数据文件进行清洗,得到清洗数据文件,包括:
19.通过所述数据清洗平台,读取所述车型文件夹和所述地域文件夹中的车辆数据的信息;
20.删除所述车辆数据中有信号缺失的数据行;
21.删除数据行小于第一设定阈值,或所述车辆数据存在时间小于第二设定阈值的数据行;
22.删除所述车辆数据中有明显异常的数据行,得到清洗数据文件;
23.将所述清洗数据文件中的清洗数据以矩阵的形式发送至所述数据提取平台。
24.可选地,所述通过数据提取平台,按照预先设定的数据提取需求与评判准则,将所述清洗数据文件进行提取,得到提取数据文件,包括:
25.获取用户定义的所述数据提取需求与所述评判准则以及用户配置的数据提取特征变量;
26.根据所述数据提取特征变量,在所述清洗数据的矩阵中生成与所述数据提取特征变量相关的特征数据矩阵;
27.在所述特征数据矩阵中,根据所述数据提取需求与所述评判准则,生成第一行数组和第二行数组,其中,在所述在数据提取需求下,所述第一行数组的表现优于所述第二行数组;
28.根据所述第一行数组与所述第二行数组,生成所述提取数据文件。
29.可选地,所述获取用户定义的所述数据提取需求与所述评判准则以及用户配置的数据提取特征变量,包括:
30.获取对车辆进行续驶里程评价的数据提取需求,以及获取根据对车辆进行续驶里程评价的数据提取需求制定的续驶里程评判准则指标;
31.其中,所述续驶里程评判准则指标定义为:在预设的偏差计算时间范围变量内,整车控制单元计算的续驶里程的变化值减去车辆真实行驶里程的变化值得到的偏差值;
32.获取用户行驶工况的数据特征提取变量。
33.可选地,所述根据所述数据提取特征变量,在所述清洗数据的矩阵中生成与所述数据提取特征变量相关的特征数据矩阵,包括:
34.根据所述用户行驶工况的数据特征提取变量,在所述清洗数据的矩阵的首行,查找钥匙开关信号与整车模式信号所在的信号列,提取所述信号列生成目标数据矩阵;
35.在所述目标数据矩阵的所述钥匙开关信号所在的信号列中,剔除无法形成起始与终止数组的数据行或所述整车模式信号所在的信号列中不是行车模式信号所对应的数据行,并生成用户行驶工况数据矩阵。
36.可选地,所述在所述特征数据矩阵中,根据所述数据提取需求与所述评判准则,生成第一行数组和第二行数组,包括:
37.在所述用户行驶工况数据矩阵中,获取预设的偏差计算时间范围变量内,整车控制单元计算的续驶里程的变化值减去车辆真实行驶里程的变化值的偏差值;
38.将所述偏差值与设定阈值进行比较,若所述偏差值大于或等于所述设定阈值,生成所述第一行数组,若所述偏差值小于所述设定阈值,生成所述第二行数组。
39.可选地,所述根据所述第一行数组与所述第二行数组,生成所述提取数据文件,包括:
40.在所述第一行数组与所述第二行数组中,对钥匙开关信号与整车模式信号所在的信号列下的数据行,按照预设的数据扩增系数以及预设的扩增方向进行数据扩增,形成最终提取数据矩阵;
41.根据所述最终提取数据矩阵,以车辆识别号码为文件名,生成所述提取数据文件。
42.本发明实施例还提供一种车辆数据提取装置,包括:
43.获取模块,用于通过用户数据自动抓取平台,获取车辆的原始数据文件;
44.分类模块,用于通过原始数据文件分类平台,将所述原始数据文件按照预设的维度进行分类,得到分类数据文件;
45.清洗模块,用于通过数据清洗平台,对所述分类数据文件进行清洗,得到清洗数据文件;
46.提取模块,用于通过数据提取平台,按照预先设定的数据提取需求与评判准则,将所述清洗数据文件进行提取,得到提取数据文件。
47.可选地,所述获取模块包括:
48.连接单元,用于通过所述用户数据自动抓取平台,建立与车辆用户数据平台以及软件数据库之间的连接;
49.存储单元,用于获取所述车辆用户数据平台上的车辆的基本属性信息,将所述基本属性信息存入所述软件数据库中;
50.第一获取单元,用于根据预设的基本属性信息以及预设的目标时间范围,获取所述车辆的原始数据文件。
51.可选地,所述分类模块包括:
52.第二获取单元,用于通过所述原始数据文件分类平台,获取所述原始数据文件中的车型信息,在所述原始数据文件中建立车型文件夹,将相同车型的原始数据文件剪切至所述车型文件夹中;
53.第二获取单元,用于在所述车型文件夹中,获取所述原始数据文件中的地域信息,在所述车型文件夹中建立地域文件夹,将相同地域的原始数据文件剪切至所述地域文件夹中。
54.可选地,所述清洗模块包括:
55.读取单元,用于通过所述数据清洗平台,读取所述车型文件夹和所述地域文件夹中的车辆数据的信息;
56.第一删除单元,用于删除所述车辆数据中有信号缺失的数据行;
57.第二删除单元,用于删除数据行小于第一设定阈值,或所述车辆数据存在时间小于第二设定阈值的数据行;
58.第三删除单元,用于删除所述车辆数据中有明显异常的数据行,得到清洗数据文件;
59.发送单元,用于将所述清洗数据文件中的清洗数据以矩阵的形式发送至所述数据
提取平台。
60.可选地,所述提取模块包括:
61.第三获取单元,用于获取用户定义的所述数据提取需求与所述评判准则以及用户配置的数据提取特征变量;
62.提取单元,用于根据所述数据提取特征变量,在所述清洗数据的矩阵中生成与所述数据提取特征变量相关的特征数据矩阵;
63.第一生成单元,用于在所述特征数据矩阵中,根据所述数据提取需求与所述评判准则,生成第一行数组和第二行数组,其中,在所述在数据提取需求下,所述第一行数组的表现优于所述第二行数组;
64.第二生成单元,用于根据所述第一行数组与所述第二行数组,生成所述提取数据文件。
65.可选地,所述第三获取单元具体用于:
66.获取对车辆进行续驶里程评价的数据提取需求,以及获取根据对车辆进行续驶里程评价的数据提取需求制定的续驶里程评判准则指标;
67.其中,所述续驶里程评判准则指标定义为:在预设的偏差计算时间范围变量内,整车控制单元计算的续驶里程的变化值减去车辆真实行驶里程的变化值得到的偏差值;
68.获取用户行驶工况的数据特征提取变量。
69.可选地,所述提取单元具体用于:
70.根据所述用户行驶工况的数据特征提取变量,在所述清洗数据的矩阵的首行,查找钥匙开关信号与整车模式信号所在的信号列,提取所述信号列生成目标数据矩阵;
71.在所述目标数据矩阵的所述钥匙开关信号所在的信号列中,剔除无法形成起始与终止数组的数据行或所述整车模式信号所在的信号列中不是行车模式信号所对应的数据行,并生成用户行驶工况数据矩阵。
72.可选地,所述第一生成单元具体用于:
73.在所述用户行驶工况数据矩阵中,获取预设的偏差计算时间范围变量内,整车控制单元计算的续驶里程的变化值减去车辆真实行驶里程的变化值的偏差值;
74.将所述偏差值与设定阈值进行比较,若所述偏差值大于或等于所述设定阈值,生成所述第一行数组,若所述偏差值小于所述设定阈值,生成所述第二行数组。
75.可选地,所述第二生成单元具体用于:
76.在所述第一行数组与所述第二行数组中,对钥匙开关信号与整车模式信号所在的信号列下的数据行,按照预设的数据扩增系数以及预设的扩增方向进行数据扩增,形成最终提取数据矩阵;
77.根据所述最终提取数据矩阵,以车辆识别号码为文件名,生成所述提取数据文件。
78.本发明实施例还提供一种车辆数据提取设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如上任一项所述的车辆数据提取方法。
79.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的车辆数据提取方法。
80.本发明的有益效果是:
81.本发明提供一种车辆数据提取方法,包括:通过用户数据自动抓取平台,获取车辆的原始数据文件;通过原始数据文件分类平台,将所述原始数据文件按照预设的维度进行分类,得到分类数据文件;通过数据清洗平台,对所述分类数据文件进行清洗,得到清洗数据文件;通过数据提取平台,按照预先设定的数据提取需求与评判准则,将所述清洗数据文件进行提取,得到提取数据文件。通过上述方案,可以降低车辆数据的处理时间,提高数据的处理质量,并且可以基于特定的需求进行数据提取,为进一步的功能开发、测试与评价提供数据依据。
附图说明
82.图1表示本发明实施例提供的车辆数据提取方法的流程图;
83.图2表示本发明实施例提供的车辆数据提取装置的结构示意图。
具体实施方式
84.为使本发明的目的、技术方案和优点更加清楚,下面将结合附图及具体实施例对本发明进行详细描述。
85.本发明针对现有技术中,难以基于特定的提取需求,对车辆的数据进行有效提取的问题,提供一种车辆数据提取方法、装置、设备及介质。
86.如图1所示,本发明实施例提供一种车辆数据提取方法,包括:
87.s101:通过用户数据自动抓取平台,获取车辆的原始数据文件;
88.s102:通过原始数据文件分类平台,将所述原始数据文件按照预设的维度进行分类,得到分类数据文件;
89.s103:通过数据清洗平台,对所述分类数据文件进行清洗,得到清洗数据文件;
90.s104:通过数据提取平台,按照预先设定的数据提取需求与评判准则,将所述清洗数据文件进行提取,得到提取数据文件。
91.需要说明的是,本实施例提供的车辆数据提取方法,建立一平台构架,包括:用户数据自动抓取平台、原始数据文件分类平台、数据清洗平台和数据提取平台,实现对纯电动汽车数据的自动获取、清洗与提取,通过此平台构架的建立,不仅将车辆数据的处理时间大幅降低,还能提高车辆数据的处理质量,并且可以基于特定的需求进行数据提取,为进一步的功能开发、测试与评价提供数据依据,为相关业务的优化与评价提供更加客观与市场化的数据依据。
92.本实施例基于mysql或python软件,通过使用c 、java等编程语言完成上述方法和平台构架的搭建。
93.可选地,所述通过用户数据自动抓取平台,获取车辆的原始数据文件,包括:
94.通过所述用户数据自动抓取平台,建立与车辆用户数据平台以及软件数据库之间的连接;
95.获取所述车辆用户数据平台上的车辆的基本属性信息,将所述基本属性信息存入所述软件数据库中;
96.根据预设的基本属性信息以及预设的目标时间范围,获取所述车辆的原始数据文
件。
97.需要说明的是,建立用户自动抓取平台与车辆用户数据平台和软件数据库之间的连接,其中,车辆用户数据平台用于获取并存储车辆在使用过程中全部的基本属性信息,用户自动抓取平台获取车辆用户数据平台上的车辆的基本属性信息和对应的车辆使用数据,将基本属性信息和车辆的使用数据逐条存入软件数据库中,之后按照需求的车辆的基本属性信息以及预设的目标时间范围自动获取目标时间范围内的车辆的基本属性信息对应的车辆使用数据,并形成原始数据文件。
98.可选地,所述通过原始数据文件分类平台,将所述原始数据文件按照预设的维度进行分类,得到分类数据文件,包括:
99.通过所述原始数据文件分类平台,获取所述原始数据文件中的车型信息,在所述原始数据文件中建立车型文件夹,将相同车型的原始数据文件剪切至所述车型文件夹中;
100.在所述车型文件夹中,获取所述原始数据文件中的地域信息,在所述车型文件夹中建立地域文件夹,将相同地域的原始数据文件剪切至所述地域文件夹中。
101.需要说明的是,通过原始数据文件分类平台将用户自动抓取平台抓取的原始数据文件按照预设的车型、地域或者其他的定义维度进行分类,避免由于数据混杂导致对后续的分析结果产生较大的偏差。
102.在本实施例中,通过原始数据文件分类平台,获取所述原始数据文件中的车型信息,在原始数据文件的路径下自动建立不同车型对应的车型文件夹,并将相同车型的原始数据文件自动剪切到车型文件夹中,之后,将目录切换至车型文件夹下,提取原始文件中的地域信息,在车型文件夹中建立不同的地域对应的地域文件夹,具体精确到“市”级,并将相同地域的原始文件夹自动剪切到地域文件夹中,完成对原始数据的分类。
103.根据定义的其他维度,比如电池型号、车辆的使用性质,包括运营车、私家车等,对原始数据进行分类的方式也属于本发明的保护范围。
104.可选地,所述通过数据清洗平台,对所述分类数据文件进行清洗,得到清洗数据文件,包括:
105.通过所述数据清洗平台,读取所述车型文件夹和所述地域文件夹中的车辆数据的信息;
106.删除所述车辆数据中有信号缺失的数据行;
107.删除数据行小于第一设定阈值,或所述车辆数据存在时间小于第二设定阈值的数据行;
108.删除所述车辆数据中有明显异常的数据行,得到清洗数据文件;
109.将所述清洗数据文件中的清洗数据以矩阵的形式发送至所述数据提取平台。
110.需要说明的是,通过所述数据清洗平台,按照预先定义的清洗规则对原始数据文件分类平台分类后的分类数据进行清洗,去除对无用的或者对后续提取和分析产生干扰的数据。
111.对各车型和各地域下的原始数据文件进行遍历,并读取其中的车辆数据的信息,查找每个文件夹中车辆数据中有信号缺失的数据行,进行删除,查找数据行的值小于规定阈值,或者车辆数据存在时间小于规定时间阈值的数据行,进行删除,查找车辆数据中与其他数据行有明显差异的数据行,例如断崖式变化的数据行或者超出有效范围区间的数据行
等,进行删除,完成对分类后的原始数据的清洗。将清洗后的车辆数据以数据矩阵的形式发送给数据提取平台。
112.可选地,所述通过数据提取平台,按照预先设定的数据提取需求与评判准则,将所述清洗数据文件进行提取,得到提取数据文件,包括:
113.获取用户定义的所述数据提取需求与所述评判准则以及用户配置的数据提取特征变量;
114.根据所述数据提取特征变量,在所述清洗数据的矩阵中生成与所述数据提取特征变量相关的特征数据矩阵;
115.在所述特征数据矩阵中,根据所述数据提取需求与所述评判准则,生成第一行数组和第二行数组,其中,在所述在数据提取需求下,所述第一行数组的表现优于所述第二行数组;
116.根据所述第一行数组与所述第二行数组,生成所述提取数据文件。
117.需要说明的是,对车辆数据进行提取的目的是为后续的数据分析提供可靠的、有效的数据支持。
118.在进行数据提取之前,数据提取平台获取用户定义的提取需求,以及根据用户定义的提取需求制定的评价规则以及配置数据提取特征变量。根据数据提取特征变量,在清洗数据的矩阵中生成与所述数据提取特征变量相关的特征数据矩阵,在特征数据矩阵中,根据数据提取需求与评判准则,生成第一行数组和第二行数组,其中,第一行数组为在数据提取需求下,表现表现较优的数据行,第二行数组为在数据提取需求下,表现表现较差的数据行。根据第一行数组与第二行数组,生成最终的提取数据文件。
119.可选地,所述获取用户定义的所述数据提取需求与所述评判准则以及用户配置的数据提取特征变量,包括:
120.获取对车辆进行续驶里程评价的数据提取需求,以及获取根据对车辆进行续驶里程评价的数据提取需求制定的续驶里程评判准则指标;
121.其中,所述续驶里程评判准则指标定义为:在预设的偏差计算时间范围变量内,整车控制单元计算的续驶里程的变化值减去车辆真实行驶里程的变化值得到的偏差值;
122.获取用户行驶工况的数据特征提取变量。
123.需要说明的是,用户的提取需求、评判准则以及特征变量支持用户的自定义,在本实施例中,用户定义的数据提取需求为对车辆的续驶里程进行评价,根据对车辆的续驶里程进行评价这一提取需求制定的评判准则,支持用户的自定义,在本实施例中,定义为续驶里程评判准则指标,按照公式:d(cdr)/dt-d(odo)/dt,进行计算,其中,cdr表示整车控制单元计算的续驶里程(caculated drive range,cdr),odo表示真实的行驶总里程(odograph,odo),dt为偏差计算时间范围变量,d(cdr)/dt表示为整车控制单元计算的续驶里程在偏差计算时间范围变量内的变化值,d(odo)/dt表示为真实的行驶总里程在偏差计算时间范围变量内的变化值。其中,偏差计算时间范围变量dt也支持用户的自定义。
124.可选地,所述根据所述数据提取特征变量,在所述清洗数据的矩阵中生成与所述数据提取特征变量相关的特征数据矩阵,包括:
125.根据所述用户行驶工况的数据特征提取变量,在所述清洗数据的矩阵的首行,查找钥匙开关信号与整车模式信号所在的信号列,提取所述信号列生成目标数据矩阵;
126.在所述目标数据矩阵的所述钥匙开关信号所在的信号列中,剔除无法形成起始与终止数组的数据行或所述整车模式信号所在的信号列中不是行车模式信号所对应的数据行,并生成用户行驶工况数据矩阵。
127.需要说明的是,数据提取特征变量也支持用户的自定义配置,在本实施例中,对车辆的续驶里程进行评价的特征提取变量为与用户行驶工况相关的特征变量,比如钥匙开关信号和整车模式信号。在特征数据矩阵的首行,即信号名行,查找钥匙开关信号和整车模式信号所在的信号列,提取相应的信号列向量生成目标数据矩阵。在目标数据矩阵中的钥匙开关信号列向量中查找成对出现的(on,off)值,提取每个“on”和“off”值所对应的数据行,两两结合形成行数组,即为一个on挡行驶周期下所对应的数据起始行和终止行。若无法形成行数组,即出现单一的“on”值或者“off”值对应的数据行,或者整车模式信号所在的信号列中不是行车模式信号所对应的数据行,将上述两种情况对应的数据行删除,形成用户行驶工况数据矩阵。
128.可选地,所述在所述特征数据矩阵中,根据所述数据提取需求与所述评判准则,生成第一行数组和第二行数组,包括:
129.在所述用户行驶工况数据矩阵中,获取预设的偏差计算时间范围变量内,整车控制单元计算的续驶里程的变化值减去车辆真实行驶里程的变化值的偏差值;
130.将所述偏差值与设定阈值进行比较,若所述偏差值大于或等于所述设定阈值,生成所述第一行数组,若所述偏差值小于所述设定阈值,生成所述第二行数组。
131.需要说明的是,遍历上述的用户行驶工况数据矩阵,在每一行数组对应的数据范围内,以偏差计算时间范围变量dt为间隔,提取整车控制单元计算的续驶里程cdr与真实的行驶总里程odo的值,按照时间先后顺序相减,即可得到多组整车控制单元计算的续驶里程在偏差计算时间范围变量内的变化值d(cdr)/dt,以及真实的行驶总里程在偏差计算时间范围变量内的变化值d(odo)/dt。按照上述的续驶里程评判准则指标的公式相减,得到多组偏差值,将每一偏差值与设定阈值进行比较,当偏差值大于或等于所述设定阈值,确定该偏差值对应的行数组为第一行数组,也就是用户驾驶行为较差,而使续驶里程算法表现较差的数据对应的数据行,偏差值小于设定阈值,确定该偏差值对应的行数组为第二行数组,也就是用户驾驶行为较优,而使续驶里程算法表现较优的数据对应的数据行。
132.可选地,所述根据所述第一行数组与所述第二行数组,生成所述提取数据文件,包括:
133.在所述第一行数组与所述第二行数组中,对钥匙开关信号与整车模式信号所在的信号列下的数据行,按照预设的数据扩增系数以及预设的扩增方向进行数据扩增,形成最终提取数据矩阵;
134.根据所述最终提取数据矩阵,以车辆识别号码为文件名,生成所述提取数据文件。
135.需要说明的是,在第一行数组与第二行数组中,提取钥匙开关信号与整车模式信号的信号列下的数据行的中的时间变量的值,并按照预设的数据扩增系数变量向时间较小的方向进行数据的扩增,以此来抵消数据传输过程中的时滞效应,形成最终的提取数据矩阵,根据所述最终提取数据矩阵,以车辆识别号码(vehicle identification number,vin)为文件名,生成excel与csv格式的文档,即为提取数据文件。
136.通过上述的车辆数据提取方法,基于对车辆的续驶里程进行评价的数据提取需
求,可以基于提取到的提取数据文件分析用户的驾驶行为与续驶里程算法的对应关系,并且可以提取不同区域、用户群体的典型驾驶工况,也可反补优化相关的控制策略开发。而且续驶里程隐形的影响因素为电池的剩余电量与剩余寿命,通过本实施例提出的车辆数据提取方法,也可以为电池寿命与健康度的预测提供相关的数据支撑依据,后续通过相应的算法优化可对电池寿命进行提升,极大降低后期的维护成本。
137.如图2所示,本发明实施例还提供一种车辆数据提取装置,包括:
138.获取模块201,用于通过用户数据自动抓取平台,获取车辆的原始数据文件;
139.分类模块202,用于通过原始数据文件分类平台,将所述原始数据文件按照预设的维度进行分类,得到分类数据文件;
140.清洗模块203,用于通过数据清洗平台,对所述分类数据文件进行清洗,得到清洗数据文件;
141.提取模块204,用于通过数据提取平台,按照预先设定的数据提取需求与评判准则,将所述清洗数据文件进行提取,得到提取数据文件。
142.可选地,所述获取模块201包括:
143.连接单元,用于通过所述用户数据自动抓取平台,建立与车辆用户数据平台以及软件数据库之间的连接;
144.存储单元,用于获取所述车辆用户数据平台上的车辆的基本属性信息,将所述基本属性信息存入所述软件数据库中;
145.第一获取单元,用于根据预设的基本属性信息以及预设的目标时间范围,获取所述车辆的原始数据文件。
146.可选地,所述分类模块202包括:
147.第二获取单元,用于通过所述原始数据文件分类平台,获取所述原始数据文件中的车型信息,在所述原始数据文件中建立车型文件夹,将相同车型的原始数据文件剪切至所述车型文件夹中;
148.第二获取单元,用于在所述车型文件夹中,获取所述原始数据文件中的地域信息,在所述车型文件夹中建立地域文件夹,将相同地域的原始数据文件剪切至所述地域文件夹中。
149.可选地,所述清洗模块203包括:
150.读取单元,用于通过所述数据清洗平台,读取所述车型文件夹和所述地域文件夹中的车辆数据的信息;
151.第一删除单元,用于删除所述车辆数据中有信号缺失的数据行;
152.第二删除单元,用于删除数据行小于第一设定阈值,或所述车辆数据存在时间小于第二设定阈值的数据行;
153.第三删除单元,用于删除所述车辆数据中有明显异常的数据行,得到清洗数据文件;
154.发送单元,用于将所述清洗数据文件中的清洗数据以矩阵的形式发送至所述数据提取平台。
155.可选地,所述提取模块204包括:
156.第三获取单元,用于获取用户定义的所述数据提取需求与所述评判准则以及用户
配置的数据提取特征变量;
157.提取单元,用于根据所述数据提取特征变量,在所述清洗数据的矩阵中生成与所述数据提取特征变量相关的特征数据矩阵;
158.第一生成单元,用于在所述特征数据矩阵中,根据所述数据提取需求与所述评判准则,生成第一行数组和第二行数组,其中,在所述在数据提取需求下,所述第一行数组的表现优于所述第二行数组;
159.第二生成单元,用于根据所述第一行数组与所述第二行数组,生成所述提取数据文件。
160.可选地,所述第三获取单元具体用于:
161.获取对车辆进行续驶里程评价的数据提取需求,以及获取根据对车辆进行续驶里程评价的数据提取需求制定的续驶里程评判准则指标;
162.其中,所述续驶里程评判准则指标定义为:在预设的偏差计算时间范围变量内,整车控制单元计算的续驶里程的变化值减去车辆真实行驶里程的变化值得到的偏差值;
163.获取用户行驶工况的数据特征提取变量。
164.可选地,所述提取单元具体用于:
165.根据所述用户行驶工况的数据特征提取变量,在所述清洗数据的矩阵的首行,查找钥匙开关信号与整车模式信号所在的信号列,提取所述信号列生成目标数据矩阵;
166.在所述目标数据矩阵的所述钥匙开关信号所在的信号列中,剔除无法形成起始与终止数组的数据行或所述整车模式信号所在的信号列中不是行车模式信号所对应的数据行,并生成用户行驶工况数据矩阵。
167.可选地,所述第一生成单元具体用于:
168.在所述用户行驶工况数据矩阵中,获取预设的偏差计算时间范围变量内,整车控制单元计算的续驶里程的变化值减去车辆真实行驶里程的变化值的偏差值;
169.将所述偏差值与设定阈值进行比较,若所述偏差值大于或等于所述设定阈值,生成所述第一行数组,若所述偏差值小于所述设定阈值,生成所述第二行数组。
170.可选地,所述第二生成单元具体用于:
171.在所述第一行数组与所述第二行数组中,对钥匙开关信号与整车模式信号所在的信号列下的数据行,按照预设的数据扩增系数以及预设的扩增方向进行数据扩增,形成最终提取数据矩阵;
172.根据所述最终提取数据矩阵,以车辆识别号码为文件名,生成所述提取数据文件。
173.本发明实施例还提供一种车辆数据提取设备,包括:处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序,所述程序被所述处理器执行时实现如上任一项所述的车辆数据提取方法。
174.本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上任一项所述的车辆数据提取方法。
175.以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来说,在不脱离本发明所述的原理前提下还可以作出若干改进和润饰,这些改进和润饰也在本发明的保护范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献