技术新讯 > 控制调节装置的制造及其应用技术 > 一种无人自主车辆的实时跟踪数据引导式学习控制方法 > 正文

一种无人自主车辆的实时跟踪数据引导式学习控制方法

国知局
2024-09-05 14:20:33

本发明涉及控制，具体涉及一种无人自主车辆的实时跟踪数据引导式学习控制方法。

背景技术：

1、目前，无人自主车辆的实时跟踪控制问题在实际应用中受到了广泛的关注。随着无人自主车辆结构的日益复杂化，以及对于无人自主车辆自主控制要求的日益提高，利用智能控制方法为无人自主车辆设计高精度控制算法成为一种趋势。针对无人自主车辆的跟踪控制目标，多数智能控制方法仅能完成无人自主车辆的稳态跟踪任务。虽然有限/固定时间控制或有限时间预定性能/预定性能控制等控制方法在重复任务中努力提高瞬态性能或精度，但它们可能无法完全满足控制精度和控制努力的双重要求。这些方法优先实现特定性能标准或在定义的时间范围内收敛，这是有价值的，但可能在处理精度和消耗控制努力之间的动态平衡方面不够充分。

2、有限/固定时间控制方法在某些情境下有效，但并非没有局限性。它无法确保在不同系统组件中保持统一的频率，也缺乏在有限时间内保证整个系统无延迟运行的能力。在控制器中包含分数指数项可能会导致在重复微分时出现许多奇异性问题，从而产生对稳定性和控制系统设计有害的复杂解。此外，分数指数项的丰富性使参数选择变得复杂。有限时间预定性能/预定性能控制也存在挑战。这种方法对系统输出和跟踪信号有很高的要求。如果系统无法始终维持在性能函数的界限内，它就会变得无响应。从一开始就需要满足性能函数界限的需求，再加上对高控制增益的要求，可能会使许多系统无法承受大的瞬态驱动，而且它是脆弱的，因为任何突然的干扰导致受限项超过性能函数边界都会使整个控制方法失败。预定函数约束的存在进一步复杂化了参数选择，特别是在实际系统中，固定参数不能任意改变，而且分段性能函数中的不连续性阻碍了平滑性，导致推导和证明lyapunov函数的连续性困难，在连续系统的分析中难以对分段lyapunov函数进行严格的证明。

技术实现思路

1、鉴于上述问题，本发明提供了一种无人自主车辆的实时跟踪数据引导式学习控制方法，解决了现有技术中需要对具有时变非线性动态运动特性的无人自主车辆进行实时跟踪的问题。

2、一方面，本发明提供了一种无人自主车辆的实时跟踪数据引导式学习控制方法，包括以下步骤：

3、步骤s1、确定无人自主车辆的期望目标轨迹；确定无人自主车辆的非线性时变动态特性；确定无人自主车辆的运动控制参数，对所述运动控制参数进行初始化；

4、步骤s2、基于所述非线性时变动态特性和当前运动控制参数，控制无人自主车辆对所述期望目标轨迹进行跟踪，获取无人自主车辆的跟踪轨迹；

5、步骤s3、基于吸引力规则对所述期望目标轨迹进行指令滤波；基于指令滤波后的期望目标轨迹、所述跟踪轨迹和当前的运动控制参数，采用数据引导式学习对当前的运动控制参数进行更新；

6、步骤s4、返回步骤s2，进行迭代更新，直至完成对无人自主车辆期望目标轨迹的完全实时跟踪。

7、优选地，步骤s1中所述确定无人自主车辆的期望目标轨迹具体为：设定yd(t)为无人自主车辆预期目标轨迹，其中t为正整数，表示运行时刻；

8、步骤s1中所述非线性时变动态特性为：

9、

10、

11、yk＝x1,k

12、其中，xi,k为无人自主车辆在第k次迭代下对应的第i个状态，为状态xi,k对时间的导数，i为状态变量的序数，n为状态变量总数量，k∈z+为迭代次数，z+为正整数集，uk为系统在第k次迭代下的控制输入；为代表1到i阶系统状态变量；fi、为无人自主车辆的第i个状态的应时变系统函数，∈为额外的时变系统函数，yk为系统在第k次迭代下的位置状态，所述xi,k、uk、fi、∈、yk均为与运行时刻t相关的时变量。

13、优选地，所述运动控制参数包括：实际运动状态xi,k，目标运动状态θi,k，控制调节参数ci，控制输入uk，时变系统函数估计量估计参数δi,k的估计量系统非线性参数ζn,k；令所述运动控制参数中各项参数的初始值为0，完成初始化。

14、优选地，步骤s3具体包括：步骤s3-1、基于吸引力规则对所述期望目标轨迹进行指令滤波，包括：由期望目标轨迹获得目标运动状态，对目标运动状态进行滤波，获取指令滤波值；步骤s3-2、更新学习估计律参数，包括：由当前位置获取实际运动状态，基于实际运动状态更新时变系统函数估计量、估计参数的估计量；步骤s3-3、根据所述无人自主车辆的指令滤波值、运动控制参数进行计算，更新无人自主车辆的控制输入。

15、优选地，步骤s3-1具体包括：由期望目标轨迹获得目标运动状态θi,k；对目标运动状态进行滤波操作：设置吸引力规则，通过下列方程组来调整滤波误差：

16、

17、

18、

19、其中，θi,k是状态变量的目标值，是状态变量的目标值的导数，作为指令滤波值，ωi为滤波带宽，αi,k为虚拟控制器对应函数，ci为第i阶控制器增益，ηi,k为第i阶的滤波器误差补偿信号状态变量，为第i阶的滤波器误差补偿信号状态变量的导数。

20、优选地，步骤s3-2具体包括：由当前位置获取实际运动状态xi,k；通过以下数据引导式学习律计算对进行迭代更新：

21、

22、

23、其中，为时变系统函数∈值的学习律投影算子，li为自适应参数，κi,k的计算方式为κi,k＝zi,k-ηi,k，其中i＝1,…,n，为估计参数δi,k的学习律投影算子，ζi,k为系统非线性参数，计算方式为：其中i＝1,…,n，其中j为求和索引，为第k次迭代下第j个状态变量的求和权重，xj,k为第k次迭代下第j个状态变量，tanh为双曲正切函数，ρk为第k次迭代的缩放因子。

24、优选地，步骤s3-3具体包括：由实际运动状态xi,k和目标运动状态θi,k计算跟踪误差zi,k；然后根据所述无人自主车辆的指令滤波值所述跟踪误差zi,k、所述控制调节参数ci、实际运动状态xi,k、步骤s3-2获取的更新后的时变系统函数估计量更新后的估计参数δn,k的估计量以及系统非线性参数ζi,k进行计算，更新无人自主车辆的控制输入uk。

25、优选地，所述更新无人自主车辆的控制输入uk的计算方式为：

26、

27、其中，zn,k＝xn,k-θn,k为第n个状态第k次迭代下系统变量的误差，当n＝1时，z1,k＝yk-yd为第k次迭代下系统的位置误差变量，cn为第n个控制调节参数，为第k次迭代下的时变系统函数∈值的估计量，为第n个状态第k次迭代下的估计参数δn,k的估计量。

28、一方面，本发明提供了一种无人自主车辆的实时跟踪数据引导式学习控制系统，其特征在于，包括：

29、确定模块，确定无人自主车辆的期望目标轨迹；确定无人自主车辆的非线性时变动态特性；确定无人自主车辆的运动控制参数，对所述运动控制参数进行初始化；

30、获取模块，基于所述非线性时变动态特性和当前运动控制参数，控制无人自主车辆进行当前迭代下整个周期的跟踪，获取无人自主车辆的跟踪轨迹；

31、调整模块，基于吸引力规则对所述期望目标轨迹进行指令滤波；基于指令滤波后的期望目标轨迹、所述跟踪轨迹和当前的运动控制参数，采用引导式学习对当前的运动控制参数进行更新；

32、更新模块，用于进行迭代更新，直至完成对无人自主车辆期望目标轨迹的完全实时跟踪。

33、优选地，所述调整模块包括：

34、指令滤波单元，用于基于吸引力规则对所述期望目标轨迹进行指令滤波，包括：由期望目标轨迹获得目标运动状态，对目标运动状态进行滤波，获取指令滤波值；

35、数据引导学习单元，用于更新学习估计律参数，包括：由所述跟踪轨迹获取实际运动状态，基于实际运动状态更新时变系统函数估计量、估计参数的估计量；

36、控制输入计算单元，用于根据所述无人自主车辆的指令滤波值、运动控制参数进行计算，更新无人自主车辆的控制输入。

37、与现有技术相比，本发明至少具有如下有益效果：

38、(1)本发明的控制策略能够根据实时反馈的跟踪误差和系统状态自适应调整无人自主车辆的控制输入，提高了系统对于不确定性和外部扰动的适应能力。使得无人自主车辆能够在各种复杂环境中保持稳定的轨迹跟踪性能。

39、(2)本发明通过采用数据引导学习控制，能够有效识别和补偿轨迹跟踪过程中出现的动态误差，系统能够在每次迭代中通过数据进行学习并减少跟踪误差，通过不断优化控制输入，精细调整车辆的行驶路径，以更准确地跟踪预定轨迹，最终实现完全实时跟踪。不同于当下热门的有限时间和规定性能控制技术，本发明可以有效避免多种对于系统和参数调节的限制，从而提供一种更加灵活和有效的解决方案。

40、(3)本发明的通过使用基于吸引力规则的指令滤波器，避免了直接计算高阶偏导数，使得误差在牵引的过程中不会逐渐增大，并且简化了控制律的设计，能够提高了计算效率，使控制策略更易于实现和调试。