技术新讯 > 五金工具产品及配附件制造技术 > 一种基于Koopman算子的球形机器人系统在线辨识方法与流程 > 正文

一种基于Koopman算子的球形机器人系统在线辨识方法与流程

国知局
2025-01-17 12:52:50

本发明涉及球形机器人系统辨识领域，尤其是涉及一种基于koopman算子的球形机器人系统在线辨识方法。

背景技术：

1、球形机器人是一种新兴的球形机器人，其依靠内部的两自由度重摆实现在平面上的灵活运动。其有着运动效率高、对抗性好、环境适应性强等优点，在安防、野外探索、巡逻防护领域都有着极大的应用潜力。但是球形机器人的强非线性、非完整性、欠驱动性等特点对机器人的感知、规划、控制等模块都制造了挑战。

2、基于模型的控制方法已被证明是解决这些问题的有力方案，但是需要一个准确的机器人模型。根据理论搭建的机器人模型往往过于复杂，难以用于实时计算，并且其中的很多与环境、摩擦耗散的系数难以准确获得，需要通过模型辨识去获得准确模型。对于非线性系统的辨识，当前方法还存在两个难点还未被良好解决：首先，非线性系统难以简洁的表述，采用非线性模型对系统进行辨识往往需要过程复杂的离线辨识实验，参数收敛难度大；然后，建立的非线性模型预测、推理、优化难度大，难以构建实时应用算法。所以，寻求对非线性系统简洁表述的模型是系统辨识工作的重中之重。

3、目前，机器人的参数辨识多是通过离线进行，包括直接测量法、参数辨识法等。对于在线辨识算法的研究较少。已有的少量研究在过程中也未考虑噪声的影响，辨识结果在高噪声场景中出现剧烈波动，乃至迭代变差，无法投入实际使用。而机器人是一种高时变系统，机器人负载、运行环境的改变都会使得系统模型发生改变。对底层控制算法的修改也会使得系统模型也会发生改变，需要上层算法做出对应的调整。这些特点使得在运行中使用固定的模型与控制算法难以满足控制要求。急需一种在线辨识方法能稳定的给出系统实时模型，以供后续的控制系统实现模型参考自适应控制。

4、非线性特性会使得模型对噪声更加敏感，进一步加大在线辨识参数收敛的难度。需要提高在线辨识鲁棒性来应对上述问题结合带来的挑战。

技术实现思路

1、本发明主要是解决现有技术所存在的模型过于复杂、难以实时计算、对噪声抵抗性不足等的技术问题，提供一种准确稳定鲁棒的基于koopman算子的球形机器人系统在线辨识方法，能针对高度非线性的理论模型建立准确的近似线性模型，避免进行专门的辨识实验，在任意环境、任意工况、任意指令下都能准确稳定的更新机器人辨识模型。

2、本发明针对上述技术问题主要是通过下述技术方案得以解决的：一种基于koopman算子的球形机器人系统在线辨识方法，包括如下步骤：

3、s1、确定球形机器人的离散动力学模型，用多维映射字典函数组ξ表示为：

4、，

5、，

6、，

7、式中，d为系统维度，x=[ψ,α,β,η]t为系统状态向量，nx表示系统状态的的维度；ψ是机器人的俯仰角，η是机器人的翻滚角，α和β分别是主轴电机和副轴电机的旋转角度，u[k]为[(k-1)ts,kts]的时间范围中的平均系统输入，ts为系统采样间隔，nu表示向量u的维度；

8、s2、采集球形机器人的实时系统状态向量x[k]以及系统输入向量u[k]，经过低通滤波器滤除高频噪声后，以历史状态向量（x[k-1]至x[k-d]等）和历史输入向量(u[k-1]至u[k-d]等)拼接形成x[k]和u[k]，按照步骤s1中的映射字典函数组ξ(x[k],u[k])对系统状态进行映射，获得映射后的观测量向量f[k]；

9、s3、按照基于卡尔曼滤波的在线辨识递推算法，更新模型系数和在线辨识相关参数矩阵，获得实时后验系数矩阵θ[k+1|k+1]，后验系数矩阵θ[k+1|k+1]可用于机器人控制系统预测和控制。

10、更新后的在线辨识模型用于后续的机器人状态预测、导航控制等。

11、作为优选，所述步骤s3具体为：

12、用n个可观测量f来表示使用koopman理论建立的机器人离散模型，如下所示：f[k]=θtf[k-1]，

13、，

14、，

15、其中，θ是需要获得的模型参数向量，将其作为卡尔曼滤波器的观测量，基于机器人的模型参数的缓变特征将预测方程简化为：

16、θ[k]=θ[k-1]，

17、在使用卡尔曼滤波更新模型参数的过程中，每个可观测量fi对应的参数向量θi=[θ1i θ2i … θni]t的更新是独立进行的；当获得新一时刻的系统状态值后，按照字典函数升维获得观测量f[k]，对于每个观测量fi[k]根据如下公式更新θi：

18、θi[k|k-1]=θi[k-1|k-1]，

19、pi[k|k-1]=pi[k-1|k-1]，

20、，

21、ki[k]=pi[k|k-1]f[k-1](ft[k-1]pi[k|k-1]f[k-1]+ri[k])，

22、，

23、pi[k|k]=(i-ki[k]ft[k-1])pi[k|k-1]，

24、其中，pi[k|k-1]为第i个参数向量θi在k时刻的先验置信度矩阵，pi[k|k]则为卡尔曼滤波更新后的后验置信度矩阵，ri[k]为第i个观测量fi在k时刻所对应的观测噪声的方差，ki[k]为θi在k时刻更新所需的增益矩阵，i则为对应维度的单位矩阵。

25、相对于标准的卡尔曼滤波算法，本发明提出的方法增加了对观测噪声ri的实时估计：使用一个滑动数组来储存过去一段时间的观测量f，使用实时获得的参数向量θi在数组上进行预测。可将拟合误差视为符合白噪声条件的观测误差，进而获得噪声方差的近似估计值，nw为窗口长度，每次更新参数向量θi时同时更新噪声方差ri和窗口数组。实验证明，使用此方法估计噪声方差能获得准确的实时估计值。

26、作为优选，步骤s3中的在线辨识算法的初始化步骤如下：

27、s31、采集一段5-10s的机器人状态轨迹和输入轨迹信息，并按照前述方法进行滤波预处理，最终获得n个时刻的状态；

28、s32、将每个时刻的状态信息按照前文提出的映射字典函数组ξ升维后，按照如下规则拼接为状态矩阵：

29、，

30、采用最小二乘法获得初始的辨识结果矩阵：

31、θinit=(ωtω)-1ωtf，

32、s33、使用辨识结果来逐个计算初始观测噪声的方差ri_init：

33、，

34、s34、根据koopman算子的维度和离散模型的维度确定系列置信度矩阵pi和增益矩阵ki的维度，将每个pi都初始化为pi_init=γi后，使用采集到的轨迹信息按照如下规则逐步滑动更新两个矩阵，直至第n个状态，从而完成参数初始化并转入在线运行阶段：

35、ki_init[j]=pi_init[j-1]f[j-1](ft[j-1]pi_init[j-1]f[j-1]+ri_init)，

36、pi_init[j]=(i-ki_init[j]ft[j-1])pi_init[j-1]，

37、γ为一个足够大的正数，比如大于等于10000。

38、作为优选，所述步骤s1具体为：

39、将球形机器人的离散动力学模型表述为：

40、x[k+1]=f(x[k],x[k-1],…,x[k-d],u[k],u[k-1],…,u[k-d])，

41、x=[ψ,α,β,η]t为系统状态向量，d为系统维度，nx表示向量x的维度；u[k]为[(k-1)ts,kts]的时间范围中的平均系统输入，ts为系统采样间隔，nu表示向量u的维度；将状态迁移流形φt_s表述为如下形式：

42、φt_s：x×u→x×u，

43、φt_s(x[0],u[0])=(x[1],u[0])，

44、，

45、，

46、引入koopman算子建立辨识模型，球形机器人的离散系统模型表述为：

47、kφf=φ°f，

48、其中，kφ表示koopman算子，f∈fφ为新空间fφ中的观测量，fφ是由机器人状态向量和输入向量联合的所有平方可积实值函数张成的无限维空间；观测量向量f由对应的字典函数族ξ给出，ξi为观测量fi对应的映射函数，n表示观测量f的总数，也正是向量的宽度；koopman算子kφ:f→fφ在新的状态空间中表示系统；°代表响应的函数组合，使得系统的前向预测表示为：

49、kφ(x[k],u[k])=φ°ξ(x[k],u[k])=ξ(x[k+1],u[k+1])，

50、使用有限维的字典函数来近似无限维空间；通过分析理论模型和考虑机器人阶次、变量之间上的耦合影响后，最终确定专属于球形机器人的n维映射字典函数组ξ：

51、。

52、作为优选，步骤s2中，数据采集具体为：通过机器人自身所带的传感器和控制器进行，按照采样周期ts进行采样：将球形机器人根据机械连接关系划分为轴体、重摆和球壳三个部分，利用传感器（例如惯性传感器imu、电机编码器等）获得机器人的实时状态信息，包括俯仰角、翻滚角、主轴电机旋转角度和副轴电机旋转角度信息；对于系统的输入向量，直接记录电机指令力矩。

53、作为优选，每经过预设时间tk后，对辨识模型进行测试与验证：选定一段机器人实际运行得到的轨迹，根据输入序列使用在线更新的模型来获得机器人的预测轨迹，计算获得预测轨迹和实际轨迹之间的加权均方根误差，加权系数由设计目标决定；如果误差小于预警限度，则继续运行在线辨识算法；如果超过预警限度，则从数据库中读取上一个测试验证时刻的系统模型和算法参数，恢复到上一个时刻的状态重新开始在线辨识，并上报预警信息。

54、本发明带来的实质性效果是：本发明引入koopman理论针对非线性球形机器人建立了近似的线性模型，能够极大程度上的拟合非线性特性，在实现高速预测推理的同时满足了精度要求。本发明提出的在线辨识的方法，将实时噪声估计引入算法，能够在高噪声场景下完成稳定鲁棒的参数更新，使得机器人可以自适应地面、负载等改变带来的影响。实验已经证明，本发明提出的方法更新参数的稳定性远优于传统算法，能满足机器人在各种野外场景下的应用。