技术新讯 > 控制调节装置的制造及其应用技术 > 车辆控制方法、装置、设备及存储介质与流程 > 正文

车辆控制方法、装置、设备及存储介质与流程

国知局
2024-07-30 09:20:39

本发明涉及车辆，尤其涉及一种车辆控制方法、装置、设备及存储介质。

背景技术：

1、目前车辆在按照规划路径行驶过程中，通常采用纯追踪控制算法计算车辆的控制参数，对于纯追踪控制算法，由于前视距离是定值，而且是基于车辆运动学的控制，其受车速影响很大，同时纯追踪控制算法对于车辆到达路径点时的姿态无法掌控，导致无法对车辆姿态的精准控制。

技术实现思路

1、本发明的主要目的在于提供一种车辆控制方法、装置、设备及存储介质，旨在解决现有技术中在车辆按照规划路径行驶过程中，无法对车辆姿态进行精准控制的技术问题。

2、为实现上述目的，本发明提供了一种车辆控制方法，所述方法包括以下步骤：

3、根据各规划路径轨迹点的轨迹点信息和车辆的位置信息确定状态观测变量；

4、根据所述状态观测变量和状态控制模型确定所述车辆的目标行驶控制参数，所述状态控制模型由价值函数估计网络和策略优化网络构成；

5、根据所述目标行驶控制参数控制所述车辆。

6、可选地，所述根据目标规划路径上各规划路径轨迹点的轨迹点信息和车辆的位置信息确定状态观测变量，包括：

7、根据所述位置信息和各规划路径轨迹点的轨迹点信息在多个规划路径轨迹点中确定所述位置信息对应的目标轨迹点；

8、根据所述目标轨迹点的轨迹点信息确定所述目标轨迹点的纵向坐标和横向坐标；

9、根据所述位置信息确定所述车辆的纵向坐标和横向坐标；

10、在所述目标轨迹点的纵向坐标和所述车辆的纵向坐标一致时，根据所述目标轨迹点的横向坐标和所述车辆的横向坐标确定所述车辆的横向偏差变量，并根据所述车辆的行驶信息和所述目标轨迹点确定所述车辆的角度偏差变量；

11、根据所述横向偏差变量和所述角度偏差变量确定状态观测变量。

12、可选地，所述根据所述车辆的行驶信息和所述目标轨迹点的轨迹点信息确定所述车辆的角度偏差变量，包括：

13、根据所述车辆的行驶信息确定车辆航向角；

14、根据所述目标轨迹点进行切线绘制，确定规划切线角度；

15、根据所述规划切线角度和所述车辆航向角确定所述车辆的角度偏差变量。

16、可选地，所述根据所述状态观测变量和状态控制模型确定所述车辆的目标行驶控制参数，包括：

17、输入所述状态观测变量至所述状态控制模型中的策略优化网络，得到车辆策略转角；

18、根据所述状态观测变量、所述车辆策略转角以及所述状态控制模型中的价值函数估计网络，得到车辆价值参数；

19、根据所述车辆价值参数和所述策略优化网络，得到目标转向角度；

20、根据所述目标转向角度确定所述车辆的目标行驶控制参数。

21、可选地，所述根据所述状态观测变量、所述车辆策略转角以及所述状态控制模型中的价值函数估计网络，得到车辆价值参数，包括：

22、根据所述状态观测变量和目标奖励函数确定目标奖励参数；

23、根据所述目标奖励参数和所述车辆策略转角对所述状态控制模型中的价值函数估计网络进行网络优化，得到优化函数估计模型；

24、根据所述优化函数估计模型确定车辆价值参数。

25、可选地，所述根据所述状态观测变量和目标奖励函数确定目标奖励参数，包括：

26、根据所述状态观测变量确定横向偏差变量和角度偏差变量；

27、根据变量映射关系确定各横向偏差范围对应的变量奖励值和各角度偏差范围对应的变量奖励值；

28、根据各横向偏差范围对应的变量奖励值和所述横向偏差变量确定横向偏差奖励值；

29、根据各角度偏差范围对应的变量奖励值和所述角度偏差变量确定角度偏差奖励值；

30、根据所述角度偏差奖励值、所述横向偏差奖励值以及目标奖励函数确定目标奖励参数。

31、可选地，所述根据所述车辆价值参数和所述策略优化网络，得到目标转向角度，包括：

32、根据所述车辆价值参数对所述策略优化网络进行网络优化，得到目标优化网络；

33、输入更新观测变量至所述目标优化网络，得到目标转向角度。

34、此外，为实现上述目的，本发明还提出一种车辆控制装置，所述车辆控制装置包括：

35、处理模块，用于根据各规划路径轨迹点的轨迹点信息和车辆的位置信息确定状态观测变量；

36、所述处理模块，还用于根据所述状态观测变量和状态控制模型确定所述车辆的目标行驶控制参数，所述状态控制模型由价值函数估计网络和策略优化网络构成；

37、控制模块，用于根据所述目标行驶控制参数控制所述车辆。

38、此外，为实现上述目的，本发明还提出一种车辆控制设备，所述车辆控制设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的车辆控制程序，所述车辆控制程序配置为实现如上文所述的车辆控制方法的步骤。

39、此外，为实现上述目的，本发明还提出一种存储介质，所述存储介质上存储有车辆控制程序，所述车辆控制程序被处理器执行时实现如上文所述的车辆控制方法的步骤。

40、本发明通过根据各规划路径轨迹点的轨迹点信息和车辆的位置信息确定状态观测变量；根据所述状态观测变量和状态控制模型确定所述车辆的目标行驶控制参数，所述状态控制模型由价值函数估计网络和策略优化网络构成；根据所述目标行驶控制参数控制所述车辆。通过上述方式，输入状态滚测变量至状态控制模型，得到车辆的目标行驶控制参数，按照目标行驶控制参数控制车辆进行行驶，基于状态控制模型使车辆能够在与环境的交互中动态调整，并能适应于多种车辆，各种车辆在行驶过程中不断进化，达到更好地跟踪控制效果，得到更为精确的车辆控制参数，能够准确控制车辆到达规划路径上各轨迹点的姿态，实现了在行驶过程中对车辆的精准控制。

技术特征：

1.一种车辆控制方法，其特征在于，所述车辆控制方法包括：

2.如权利要求1所述的车辆控制方法，其特征在于，所述根据目标规划路径上各规划路径轨迹点的轨迹点信息和车辆的位置信息确定状态观测变量，包括：

3.如权利要求2所述的车辆控制方法，其特征在于，所述根据所述车辆的行驶信息和所述目标轨迹点的轨迹点信息确定所述车辆的角度偏差变量，包括：

4.如权利要求1所述的车辆控制方法，其特征在于，所述根据所述状态观测变量和状态控制模型确定所述车辆的目标行驶控制参数，包括：

5.如权利要求4所述的车辆控制方法，其特征在于，所述根据所述状态观测变量、所述车辆策略转角以及所述状态控制模型中的价值函数估计网络，得到车辆价值参数，包括：

6.如权利要求5所述的车辆控制方法，其特征在于，所述根据所述状态观测变量和目标奖励函数确定目标奖励参数，包括：

7.如权利要求4所述的车辆控制方法，其特征在于，所述根据所述车辆价值参数和所述策略优化网络，得到目标转向角度，包括：

8.一种车辆控制装置，其特征在于，所述车辆控制装置包括：

9.一种车辆控制设备，其特征在于，所述车辆控制设备包括：存储器、处理器及存储在所述存储器上并可在所述处理器上运行的车辆控制程序，所述车辆控制程序配置有实现如权利要求1至7中任一项所述的车辆控制方法。

10.一种存储介质，其特征在于，所述存储介质上存储有车辆控制程序，所述车辆控制程序被处理器执行时实现如权利要求1至7中任一项所述的车辆控制方法。

技术总结本发明属于车辆技术领域，公开了一种车辆控制方法、装置、设备及存储介质。本发明通过根据各规划路径轨迹点的轨迹点信息和车辆的位置信息确定状态观测变量；根据状态观测变量和状态控制模型确定车辆的目标行驶控制参数，状态控制模型由价值函数估计网络和策略优化网络构成；根据目标行驶控制参数控制车辆。通过上述方式，基于状态控制模型使车辆能够在与环境的交互中动态调整，并能适应于多种车辆，各种车辆在行驶过程中不断进化，达到更好地跟踪控制效果，得到更为精确的车辆控制参数，能够准确控制车辆到达规划路径上各轨迹点的姿态，实现了在行驶过程中对车辆的精准控制。技术研发人员：曹佳腾,刘会凯,侯明洋受保护的技术使用者：岚图汽车科技有限公司技术研发日：技术公布日：2024/7/18