技术新讯 > 车辆装置的制造及其改造技术 > 一种车辆状态确定方法、装置、设备及可读存储介质与流程 > 正文

一种车辆状态确定方法、装置、设备及可读存储介质与流程

国知局
2024-08-02 16:27:48

本技术涉及汽车，具体涉及一种车辆状态确定方法、装置、设备及可读存储介质。

背景技术：

1、车辆状态估计是汽车电子控制系统中的核心技术之一。常用的车辆状态估计方法包括卡尔曼滤波、扩展卡尔曼滤波等。这些方法通常需要依赖车辆运动模型，但在实际应用中，由于车辆的非高斯性以及传感器误差等因素的影响，这些方法的估计结果往往会存在误差较大的问题，限制了其应用范围。在这种情况下，可以采用强跟踪滤波(strongtracking filter，stf)对不确定的系统进行自适应估计，提高状态估计的精度和稳定性。

2、然而，在stf滤波过程中，需要获取人工标定后的imu传感器输出的信息(如车辆的纵、侧向加速度)，传统的惯性传感器(nertia measurement unit，imu)标定方法通常需要人工干预和手动调整参数，容易引入人为误差，并且对标定环境和条件要求高，这些都容易引入人为误差，导致标定结果的准确性和鲁棒性较差，最终使得stf滤波效果较差，难以保证车辆状态估计的精度。此外，在传统的stf滤波过程中，需要人工调节状态噪声协方差q和量测噪声协方差r，传统滤波中的q、r通常是基于一定的假设和场景人工选定，难以适应车辆在不同工况下实时变化的噪声环境和滤波需求，当系统的噪声特征发生变化时，需要人工重新调节噪声协方差q和r的值，导致传统的stf滤波对车辆不同工况的适应性较差，从而降低了车辆状态估计的准确性。

技术实现思路

1、本技术提供一种车辆状态确定方法、装置、设备及可读存储介质，该方法可以实现对车辆状态的准确估计，提高车辆状态估计的精度。

2、本技术的技术方案是这样实现的：

3、本技术实施例提供一种车辆状态确定方法，包括：

4、获取车载传感器采集到的第一行驶数据；将所述第一行驶数据输入至经过训练的循环神经网络模型，得到第二行驶数据；所述第一行驶数据和所述第二行驶数据的类型相同；基于所述第二行驶数据，确定强跟踪滤波器的量测向量和第一噪声协方差矩阵；根据所述量测向量和所述第一噪声协方差矩阵，确定所述车辆的行驶状态。

5、可以理解的是，在本技术实施例提供的车辆状态确定方法中，通过经过训练的循环神经网络对第一行驶数据进行处理，可以获得较为准确的第二行驶数据，进一步地，根据第二行驶数据可以确定出准确性较高的跟踪滤波器的量测向量和第一噪声协方差矩阵，基于该量测向量和第一噪声协方差矩阵，可以实现强跟踪滤波器对车辆状态的准确估计，提高车辆状态估计的精度。

6、在一些实施例中，所述基于所述第二行驶数据，确定强跟踪滤波器的量测向量和第一噪声协方差矩阵，包括：基于所述第二行驶数据构建强化学习模型的状态空间数据和强跟踪滤波器的量测向量；将所述状态空间数据输入至所述强化学习模型，得到所述第一噪声协方差矩阵。

7、可以理解的是，由于第二行驶数据是基于经过的循环神经网络模型进行处理后得到的接近于真实车辆行驶数据的车辆行驶数据，因此，基于第二行驶数据可以构建出准确性较高的状态空间数据和量测向量，通过强化学习模型可以获得准确的第一噪声协方差矩阵，后续在根据第一噪声协方差矩阵和量测向量进行车辆状态估计时，可以提高强跟踪滤波器估计质心侧偏角的精度。

8、在一些实施例中，所述将所述状态空间数据输入至所述强化学习模型，得到所述第一噪声协方差矩阵，包括：将所述状态空间数据输入至所述强化学习模型，得到所述强跟踪滤波器的候选噪声协方差矩阵；基于所述候选噪声协方差矩阵，确定所述车辆的候选质心侧偏角；基于所述候选质心侧偏角和参考质心侧偏角，确定所述强化学习模型对应奖励策略价值函数的的候选奖励值；所述参考质心侧偏角是在整车测试阶段通过所述车辆的惯性导航系统采集得到的；根据候选奖励值和奖励阈值之间的大小关系，确定所述第一噪声协方差矩阵。

9、可以理解的是，通过将状态空间参数输入至强化学习模型，根据输出的候选噪声协方差矩阵确定候选质心侧偏角，并根据质心侧偏见和参考质心侧偏角确定的候选奖励值和奖励阈值之间的大小关系，可以实现噪声协方差矩阵的自适应调节，确定出较优的第一噪声协方差矩阵。

10、在一些实施例中，所述根据候选奖励值和奖励阈值之间的大小关系，确定所述所述第一噪声协方差矩阵，包括：若所述候选奖励值小于或等于奖励阈值，根据所述候选奖励值调整所述强化学习模型的网络参数，并获得新的候选奖励值；根据所述新的候选奖励值和所述奖励阈值之间的大小关系，确定所述所述第一噪声协方差矩阵。

11、可以理解的是，在候选奖励值小于或等于奖励阈值的情况下，通过根据候选奖励值调整强化学习模型的网络参数，根据获得的新的候选奖励值和奖励阈值之前的大小关系，确定第一噪声协方差矩阵，可以实现对噪声协方差的自适应调整，避免了人工调整噪声协方差矩阵导致强跟踪滤波器的适应性差的问题。

12、在一些实施例中，所述根据候选奖励值和奖励阈值之间的大小关系，确定所述第一噪声协方差矩阵，包括：若所述候选奖励值大于所述奖励阈值，将所述候选噪声协方差矩阵作为所述第一噪声协方差矩阵。

13、可以理解的是，在候选奖励值大于奖励阈值的情况下，便获得了准确性较高的噪声协方差矩阵，因此，将当前次学习过程中输出的候选噪声协方差矩阵作为第一噪声协方差矩阵，可以使得后续强跟踪滤波器在基于第一噪声协方差矩阵进行质心侧偏角估计时，可以获得较为准确的估计值。

14、在一些实施例中，所述基于所述候选质心侧偏角和参考质心侧偏角，确定所述强化学习模型对应奖励策略价值函数的候选奖励值，包括：基于初始质心侧偏角，构建质心侧偏角范围；所述初始质心侧偏角是基于噪声协方差矩阵经验值确定的；基于所述候选质心侧偏角和所述参考质心侧偏角，确定斯皮尔曼相关系数；基于所述候选质心侧偏角、所述质心侧偏角范围和所述斯皮尔曼相关系数，确定所述候选奖励值。

15、可以理解的是，通过候选质心侧偏角和参考质心侧偏角确定的斯皮尔曼系数，以及候选质心侧偏角和质心侧偏角范围的关系，可以是的确定出策略价值函数的候选奖励值更加合理，保证通过强化学习模型的优化可以获得准确性较高的第一噪声协方差矩阵。

16、在一些实施例中，所述第一噪声协方差矩阵包括状态噪声协方差矩阵和量测噪声协方差矩阵；

17、所述根据所述量测向量和所述第一噪声协方差矩阵，确定所述车辆的行驶状态，包括：根据所述量测向量、所述状态噪声协方差矩阵和量测噪声协方差矩阵，创建质心侧偏角估计系统状态空间方程和量测方程；基于所述质心侧偏角估计系统状态空间方程和量测方程，确定目标质心侧偏角；基于所述目标质心侧偏角，确定所述车辆的行驶状态。

18、可以理解的是，通过经过训练的循环神经网络处理后得到的量测向量，以及强化学习模型确定状态噪声协方差矩阵和量测噪声协方差矩阵，可以使得建立的质心侧偏角估计系统状态空间方程和量测方程较为准确，因此通过该质心侧偏角估计系统状态空间方程和量测方程对目标质心侧偏角进行估计，可以提高估计的精度。

19、在一些实施例中，所述基于所述质心侧偏角估计系统状态空间方程和量测方程，确定目标质心侧偏角，包括：基于状态向量先验估计值和协方差矩阵先验估计值，预测整车运动状态先验估计值；基于时变渐消因子对滤波增益进行修正；基于修正后的所述滤波增益和所述整车运动状态先验估计值，确定所述整车运动状态后验估计值；根据所述整车运动状态后验估计值，确定目标质心侧偏角。

20、可以理解的是，通过引入时变渐消因子对滤波增益进行修正，实现自动调整滤波器的参数以适应系统变化，从而可以提高强跟踪滤波器对车辆状态估计的精度和稳定性。

21、在一些实施例中，所述整车运动状态后验估计值包括质心侧偏角估计值；所述根据所述整车运动状态后验估计值，确定目标质心侧偏角，包括：确定所述质心侧偏角估计值和参考质心侧偏角之间的差值绝对值；所述参考质心侧偏角是在整车测试阶段通过所述车辆的惯性导航系统采集得到的；根据所述差值绝对值和质心侧偏角阈值的大小关系，确定所述目标质心侧偏角。

22、可以理解的是，根据质心侧偏角估计值和参考质心侧偏角的差值绝对值与质心侧偏角阈值之间的大小关系，可以确定强跟踪滤波器估计得到的质心侧偏角和真实质心侧偏角之间的差异，从而可以使得最终确定的目标质心侧偏角接近或与真实质心侧偏角相同。

23、在一些实施例中，所述根据所述差值绝对值和执行侧偏角阈值的大小关系，确定所述目标质心侧偏角，包括：若所述差值绝对值小于或等于质心侧偏角阈值，将所述质心侧偏角的估计值确定为所述目标质心侧偏角。

24、可以理解的是，差值绝对值小于或等于质心侧偏角阈值说明质心侧偏角估计值和真实质心侧偏角相差不大或十分接近，因此将质心侧偏角估计值确定为目标质心侧偏角，可以提高车辆状态估计的准确性。

25、在一些实施例中，所述根据所述差值绝对值和执行侧偏角阈值的大小关系，确定所述目标质心侧偏角，包括：若所述差值绝对值大于所述质心侧偏角阈值，更新状态向量先验估计值和协方差矩阵先验估计值；基于更新后的状态向量先验估计值和协方差矩阵先验估计值，确定目标质心侧偏角。

26、可以理解的是，在质心侧偏角估计值和真实质心侧偏角之间的差异较大的情况下，通过对状态向量先验估计值和协方差矩阵先验估计值进行更新，实现强跟踪滤波器状态的递归估计，可以对质心侧偏角估计值进行寻优，使得最终可以确定出较为准确的目标质心侧偏角。

27、在一些实施例中，所述循环神经网络模型的训练过程包括：获取车辆行驶样本数据；将所述车辆行驶样本数据输入至初始循环神经网络模型，得到第三行驶数据；根据所述第三行驶数据和参考车辆行驶数据，对所述初始循环神经网络模型进行反向传播训练，得到所述经过训练的循环神经网络模型；所述参考车辆行驶数据通过所述车辆的惯性导航系统采集得到。

28、可以理解的是，通过车辆行驶样本数据对初始循环神经网路模型进行训练，可以使得训练好的循环神经网络可以在应用阶段，对通过车载传感器采集的第一行驶数据进行修正或矫正，可以得到接近于真实车辆行驶数据的第二行驶数据。

29、在一些实施例中，所述根据所述第三行驶数据和参考车辆行驶数据，对所述初始循环神经网络模型进行反向传播训练，得到所述经过训练的循环神经网络模型，包括：基于预设损失函数、所述第三行驶数据和所述参考车辆行驶数据，确定损失函数值；根据所述损失函数值和预设阈值，调整所述初始循环神经网络模型的网络参数，直至满足收敛条件，得到所述经过训练的循环神经网络模型。

30、可以理解的是，基于预设损失函数、初始循环神经网络模型输出的第三行驶数据和参考车辆行驶数据确定损失函数值，并根据损失函数值和预设阈值调整初始循环神经网络模型的网络参数，可以实现对初始循环神经网络模型的不断优化，使得最终得到的经过训练的循环神经网络模型可以对车载传感器采集得到的第一行驶数据进行校正，相当于完成了对车载传感器的标定。本技术实施例提供一种车辆状态确定装置，包括：

31、第一获取模块，获取车载传感器采集到的第一行驶数据；

32、第二获取模块，用于将所述第一行驶数据输入至经过训练的循环神经网络模型，得到第二行驶数据；所述第一行驶数据和所述第二行驶数据的类型相同；

33、第一确定模块，用于基于所述第二行驶数据，确定强跟踪滤波器的量测向量和第一噪声协方差矩阵；

34、第二确定模块，用于根据所述量测向量和所述第一噪声协方差矩阵，确定所述车辆的行驶状态。

35、本技术实施例提供一种车辆状态确定设备，包括：

36、存储器，用于存储车辆状态确定指令；

37、处理器，用于执行所述存储器中存储的可执行车辆状态确定指令时，实现本技术实施例中提供的方法。

38、本技术实施例提供一种计算机可读存储介质，计算机存储介质中存储有计算机可执行指令，计算机可执行指令配置为执行上述车辆状态确定方法。

39、本技术实施例提供的车辆状态确定方法，一方面，利用循环神经网络模型适应车载传感器的非线性特性和动态变化，完成基于循环神经网络模型的车载传感器标定，同时循环神经网络模型输出纵、侧向加速度作为强跟踪滤波其的量测向量；另一方面，使用强化学习模型能根据环境的变化和反馈进行自适应学习，实现不同工况下滤波过程中噪声协方差矩阵的自适应调节。利用循环神经网络模型、强化学习模型实现对传统强跟踪滤波的优化，解决了现有的车辆状态估计技术中，基于传统滤波的车辆状态估计算法存在的鲁棒性差，精度低的问题。