一种汽车横向控制器参数自标定方法
- 国知局
- 2024-07-31 23:41:43
本发明涉及智能汽车控制,具体为一种汽车横向控制器参数自标定方法。
背景技术:
1、智能汽车包含感知、决策、规划和控制多个功能模块,其中控制包括对车辆的横纵向控制,而横向控制器直接控制方向盘转角使得车辆按照规划轨迹行驶。
2、横向控制器的参数往往需要工程师通过重复实验并结合人工经验进行调整,以达到高精度的跟踪结果。一方面,对于不同的车辆行驶工况,例如车速发生变化时,原有参数不再能胜任高精度的跟踪要求,需要重新在该工况下标定。另一方面,当控制器的应用车型发生变化时,需要工程师进行参数再调节。对于较少控制参数的控制器而言,可以通过人工调整在较短的时间内调节完毕,而当参数数量较多时采用人工标定的方法将不再可行。
3、为了解决类似的问题,工程师开发了基于模型的强化学习算法,其中较为代表性的是pilco算法,其解决了类如车推杆、杆平衡等问题,该算法充分利用了已有的观测数据,结果展现了较高的参数自标定效率。在pilco算法中,需要在状态传播过程中计算控制器输出的状态分布和该分布关于控制参数的梯度信息,该过程使用矩匹配的方法进行求解。其中解析公式的推导较为复杂,因此在扩展其他控制器时较为不便。
技术实现思路
1、针对现有技术中存在的问题,本发明的目的是:提供一种汽车横向控制器参数自标定方法,可在小数据集下完成车辆的参数自动标定标定,且方便扩展至其他控制器。
2、为了达到上述目的,本发明采用如下技术方案:
3、一种汽车横向控制器参数自标定方法,包括以下步骤,
4、s1、构建或更新车辆动力学数据集,数据集中包括车速信息、车辆行驶位置和控制指令;
5、s2、对数据集进行第一步预处理,筛选出目标车速附近范围内的行驶子数据集,该目标车速为待标定参数的目标行驶工况;
6、s3、对每个子数据集进行第二步预处理:对第一帧数据的横纵向位置进行阶跃误差偏移,并将子数据集的其余数据进行坐标转化;
7、s4、使用第二步预处理后的子数据集训练高斯过程,建立车辆不确定性动力学模型;
8、s5、设置阶跃误差跟踪场景,基于车辆不确定性动力学模型进行状态传播,得到车辆状态变量;
9、s6、根据车辆状态变量,计算得到控制周期内的累计损失;
10、s7、根据链式法则计算累计损失关于控制参数的梯度,并根据学习率完成一次梯度下降,并更新控制器参数。
11、进一步地,步骤s1中的车辆动力学数据集通过已有的数据库或使用当前控制参数进行实车实验来获取。
12、进一步地,步骤s1中行驶位置为笛卡尔坐标系的横向位置x、纵向位置y和航向角θ,控制指令为方向盘转角的响应值u。
13、进一步地,步骤s3中对第一帧数据的横纵向位置进行阶跃误差偏移时,以该偏移点为坐标原点,以航向角为局部坐标的x轴方向进行子数据集中其余数据的坐标转化。
14、进一步地,步骤s4中使用实车行驶数据训练车辆不确定性动力学模型,其中车辆不确定性动力学模型的输入为车辆的在笛卡尔坐标系下的纵向位置、航向角和方向盘控制指令的联合高斯分布,输出为纵向位置和航向角变化量的联合分布。
15、进一步地,步骤s5设置阶跃误差跟踪场景时,目标轨迹为存在初始横向偏差的直线轨迹,假设车辆初始状态属于高斯分布,用车辆不确定性动力学模型进行状态传播过程中,控制量分布使用蒙特卡洛的方法进行近似求解。
16、进一步地,步骤s6中当目标轨迹为直线时,横向误差和航向角误差为ed,t=yt;eθ,t=θt,其中ed,t和eθ,t分别为t时刻下的横向误差和航向角误差,yt和θt分别为t时刻下的车辆纵坐标位置和航向角。
17、进一步地,步骤s7中使用蒙特卡洛的方法对控制分布关于参数的梯度进行近似求解。
18、进一步地,车辆不确定性动力学模型分别训练了两个独立的高斯过程,两者输入均为纵向位置、航向角和方向盘控制指令的联合高斯分布,其中一个高斯过程负责输出纵向位置变化量的高斯分布,另一个高斯过程负责输出航向角变化量的高斯分布,则两者的联合高斯分布的均值和方差为μδ=[μδy,μδθ]t,σδ=diag([σδy,σδθ]),其中μδy和μδθ分别为纵向位置和航向角的分布均值,σδy和σδθ分别为纵向位置和航向角的分布方差。
19、进一步地,重复步骤s5至s7,直至达到当前迭代的最大梯度下降次数或控制参数收敛,更新实际系统的控制参数;
20、重复步骤s1至s7完成多次参数迭代,直至标定参数的跟踪性能达到预期或达到最大迭代次数。
21、总的说来,本发明具有如下优点:
22、本发明首先通过数据驱动的方式建立了车辆不确定性动力学模型,该模型代替真实车辆系统,因此参数的自标定过程是离线进行的,减少了实车实验次数。基于该不确定性动力学模型进行车辆跟踪过程中的状态传递,建立了用于评估跟踪性能的损失函数,有效性地实现控制参数自标定。在本发明中,对pilco进行了改进,通过蒙特卡洛的方法进行控制变量的分布估计和梯度估计,避免了非线性控制器繁琐的解析公式推导,可方便地扩展其他控制器。
技术特征:1.一种汽车横向控制器参数自标定方法,其特征在于:包括以下步骤,
2.根据权利要求1所述的一种汽车横向控制器参数自标定方法,其特征在于:步骤s1中的车辆动力学数据集通过已有的数据库或使用待标定控制参数进行实车实验来获取。
3.根据权利要求1所述的一种汽车横向控制器参数自标定方法,其特征在于:步骤s1中行驶位置为笛卡尔坐标系的横向位置x、纵向位置y和航向角θ,控制指令为方向盘转角的响应值u。
4.根据权利要求1所述的一种汽车横向控制器参数自标定方法,其特征在于:步骤s3中对第一帧数据的横纵向位置进行阶跃误差偏移时,以该偏移点为坐标原点,以航向角为局部坐标的x轴方向进行子数据集中其余数据的坐标转化。
5.根据权利要求1所述的一种汽车横向控制器参数自标定方法,其特征在于:步骤s4中使用实车行驶数据训练车辆不确定性动力学模型,其中车辆不确定性动力学模型的输入为车辆的在笛卡尔坐标系下的纵向位置、航向角和方向盘控制指令的联合高斯分布,输出为纵向位置和航向角变化量的联合分布。
6.根据权利要求1所述的一种汽车横向控制器参数自标定方法,其特征在于:步骤s5设置阶跃误差跟踪场景时,目标轨迹为存在初始横向偏差的直线轨迹,假设车辆初始状态属于高斯分布,用车辆不确定性动力学模型进行状态传播过程中,控制量分布使用蒙特卡洛的方法进行近似求解。
7.根据权利要求1所述的一种汽车横向控制器参数自标定方法,其特征在于:步骤s6中当目标轨迹为直线时,横向误差和航向角误差满足ed,t=yt;eθ,t=θt,其中ed,t和eθ,t分别为t时刻下的横向误差和航向角误差,yt和θt分别为t时刻下的车辆纵坐标位置和航向角。
8.根据权利要求1所述的一种汽车横向控制器参数自标定方法,其特征在于:步骤s7中使用蒙特卡洛的方法对控制分布关于参数的梯度进行近似求解。
9.根据权利要求1所述的一种汽车横向控制器参数自标定方法,其特征在于:车辆不确定性动力学模型分别训练了两个独立的高斯过程,两者输入均为纵向位置、航向角和方向盘控制指令的联合高斯分布,其中一个高斯过程负责输出纵向位置变化量的高斯分布,另一个高斯过程负责输出航向角变化量的高斯分布,则两者的联合高斯分布的均值和方差为μδ=[μδy,μδθ]t,σδ=diag([σδy,σδθ]),其中μδy和μδθ分别为纵向位置和航向角的分布均值,σδy和σδθ分别为纵向位置和航向角的分布方差。
10.根据权利要求1所述的一种汽车横向控制器参数自标定方法,其特征在于:重复步骤s5至s7,直至达到当前迭代的最大梯度下降次数或控制参数收敛,更新实际系统的控制参数;
技术总结本发明涉及一种汽车横向控制器参数自标定方法,根据数据库或待标定参数进行跟踪控制获取车辆行驶数据,在对数据进行预处理后训练车辆不确定性动力学模型。设置阶跃误差跟踪场景,基于车辆不确定性动力学模型进行车辆状态的长期迭代预测,再设计关于跟踪误差的损失函数,计算长期预测的累计损失。基于累计损失进行参数梯度下降,直至达到最大下降次数或参数收敛。不断重复更新车辆不确定性动力学模型和参数更新,实现参数的多次标定。本发明基于高斯过程,建立了车辆不确定性动力学模型,并基于该模型进行参数的离散自标定,可在小数据集下完成车辆的参数的标定问题,可应用至智能汽车横向控制器的工程开发中,加快工程师对参数的标定速度。技术研发人员:赵克刚,张政,梁志豪受保护的技术使用者:华南理工大学技术研发日:技术公布日:2024/6/18本文地址:https://www.jishuxx.com/zhuanli/20240730/198121.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。