技术新讯 > 控制调节装置的制造及其应用技术 > 一种不确定噪声环境下的迭代学习安全临界控制方法  >  正文

一种不确定噪声环境下的迭代学习安全临界控制方法

  • 国知局
  • 2024-08-01 00:11:34

本发明涉及机器人传感器控制/安全关键系统的,尤其涉及一种不确定噪声环境下的迭代学习安全临界控制方法,是基于随机控制障碍函数在不确定噪声环境下学习安全关键控制。

背景技术:

1、在不确定噪声环境中使用随机控制障碍函数(control barrier functions,cbfs)学习安全关键控制是一种应对现实世界中不确定性和噪声的控制策略。安全关键控制是指在控制系统中确保系统状态始终满足安全约束的控制目标,在军事和工业的各个领域具有重要意义。然而,真实环境中存在各种不确定性因素,例如传感器误差、外部干扰和模型误差等,这些因素可能导致控制系统无法准确地满足安全约束。因此,设计出合适的控制障碍函数是实现噪声环境安全自适应控制的关键,受到大量研究人员的关注。

2、在实际应用中,激光雷达在不确定环境中测量的数据往往是包含高斯噪声的。在安全关键系统的设计中,很难完全获得实时的环境数据,因此有必要考虑使用学习方法来感知环境以确保安全。该技术的基本思想是通过学习一个随机cbf模型,随机cbf模型能够根据当前系统状态和随机噪声生成一个cbf函数。随机cbf模型可以利用高斯过程进行训练,以适应不确定噪声环境中的控制需求。通过将随机cbf函数与控制器结合,可以设计出具有鲁棒性和适应性的安全关键控制器,能够在噪声环境中有效地满足系统的安全约束。

3、值得注意的是,目前大多数研究人员所采用的方法是采用普通cbf函数进行安全关键控制,然而,这些传统的cbf方法通常假设系统的输入和扰动是已知和确定的,并且需要提前设计cbf函数,并且对系统的动态变化和扰动不具备适应性。但在实际应用中,存在各种不确定性因素。随机cbf引入了随机性,可以根据实时的系统状态和随机噪声生成cbf函数,从而能够更好地适应系统的变化和噪声扰动。

4、申请号为202211323281.5的发明专利公开了一种基于离散控制障碍函数的人机协作控制方法,具体操作过程为采集人体骨架关节点数据:通过深度相机采集人体运动数据并提取骨骼关键点或动作捕捉系统采集骨骼关键点,将人体各部分表示为由骨骼点连接的刚性线段;递推最小二乘法在线预测人体关节轨迹与不确定度;判定最近点和最小距离;预测最近点的轨迹和不确定度;构建带有预测轨迹和不确定度的最小距离的安全约束;通过优化求出与原始控制输入最接近的控制率,控制机器人运动,而后继续读取机器人关节位置,重新采集人体骨架关节点位置,重复预测得到最终控制公式。上述发明基于人机空间位置的最近点轨迹预测与不确定度预测方法,帮助准确定义未来时刻的人机最小距离。但是,该发明在安全约束构建的过程中是完全已知与障碍物之间的距离,并没有学习环境的过程,这样控制器会出现局限性和不确定性。

技术实现思路

1、针对现有的安全关键控制存在高度依赖精确数据和高不确定性的技术问题,本发明提出一种不确定噪声环境下的迭代学习安全临界控制方法,基于实时传感器数据的学习框架,用于在考虑安全性和低不确定性的情况下,在不确定环境下估计能够达到预期目标的cbfs,能在不确定环境下保证机器人的安全性,且具有低不确定性。

2、为了达到上述目的,本发明的技术方案是这样实现的:

3、本发明首先通过机器人自身的传感器来获取到与不安全物体的距离信息集合;通过距离数据集构建出高斯回归模型;构建核函数和协方差函数;设计出关于核函数和协方差函数的归零控制障碍函数不等式;通过求解不等式从而实现保证机器人对的安全性和低不确定性。

4、一种不确定噪声环境下的迭代学习安全临界控制方法,其步骤如下:

5、步骤一:将传感器实时获取的机器人到障碍物边缘的距离作为数据样本,生成安全距离数据集;

6、步骤二:构建环境和机器人模型:设置移动的机器人的工作区域,确定移动机器人的控制系统,并构建反馈标称控制器;

7、步骤三:利用安全距离数据集基于学习的方法合成控制障碍函数并构建高斯核函数训练数据,设计均值函数和协方差函数分别表示安全距离和低不确定性;

8、步骤四:定义两个归零障碍函数实现不确定噪声环境下机器人使用随机控制障碍函数学习的安全关键控制。

9、优选地,所述移动机器人的控制系统为:根据非线性仿射控制系统,定义非线性形式下的机器人控制系统为:

10、

11、其中,是机器人的状态向量,r=[θx,θy]t和θ是机器人系统的二维坐标和转向角,v是线速度,ω是角速度,分别是状态向量p、二维坐标r、转向角θ的导数,x表示机器人的状态,x为状态x的导数,f(x),g(x)是满足局部lipschitz的函数。

12、优选地,所述非线性仿射控制系统为

13、x(0)=x0;

14、其中,为系统的状态,是控制输入,x和u分别为状态空间和控制空间,x表示机器人的状态,n表示状态的输入维度,x(0)表示状态的初始值;

15、仿射控制系统的安全集由连续可微函数h的超水平集来描述:即,xs={x∈x:h(x)≥0},不安全集为xu={x∈x:h(x)<0};如果轨迹xt,t≥t0永远不会进入不安全集xu,则认为控制输入u(x)是安全的。

16、优选地,由连续可微函数h(x)表示的控制障碍函数用于保证非线性仿射控制系统的安全性的三个约束条件为:

17、

18、其中,α(·)是在整条真实的直线上严格递增的扩展类函数。

19、优选地,所述构建反馈标称控制器的方法为:

20、给定标称控制器k(x),通过构造满足三个约束条件的控制障碍函数,可以建立二次规划控制器,以找到最小成本的方式来修改标称控制器k(x),从而保证安全;所述二次规划控制器为:

21、

22、机器人没有障碍物的先验知识,但训练数据集可用,具有已知的协方差σn,机器人的动力学方程是和x=p=[rθ]t,其中状态变量是机器人的位置和方向,是控制变量;对于所有状态x∈x,反馈标称控制器为:

23、

24、其中,l是机器人的轴距,rd是球域。

25、优选地,所述利用安全距离数据集基于学习的方法合成控制障碍函数的方法为:通过安全距离数据集基于学习的方法合成控制障碍函数为:

26、

27、其中,μ(x)是均值函数,σ(x)是协方差函数,表示随机控制障碍函数,n()表示符合均值函数和协方差函数的函数分布;

28、设均值函数μ(x)是一个正常的控制障碍函数,均值函数μ(x)满足三个约束条件,机器人的轨迹约束到安全区域的安全约束为:μ(x)≥0;

29、选择合适的值将协方差函数σ(x)约束得到不确定性约束为:σ(x)≤σ0;其中,σ0表示边界参数值;

30、由均值函数μ(x)和相应的不确定性协方差函数σ(x)在线估计不安全集合xu:找到控制输入u(x)确保机器人从任意初始值x0∈xo开始到目标区域xg的安全轨迹满足安全约束和不确定性约束。

31、优选地,所述构建高斯核函数训练数据的方法为:

32、连续可微函数h(x)用高斯核函数近似,其中是均值函数,是一个协方差函数即核函数,限定了任何两个状态x,x′∈x之间的相似性;所示协方差函数是平方指数核且:

33、

34、其中,gp()表示高斯回归函数,n为数据标号,xj、x′j、lj分别表示训练集、测试集、超参数;超参数ψ=[σf,l1,...,ln]t包括信号方差和长度尺度超参数ψ根据贝叶斯原理通过最大化的似然函数获得或使用基于凸性的方法找到。

35、优选地,给定包含n个数据样本的训练集d,其中输入和输出设加性测量噪声存在于协方差σn已知的输出向量中;对于当前输入的状态x*和输出状态建模为与训练数据联合高斯分布:

36、

37、其中,表示训练的输出,中间变量且矩阵其中,k(x1,x1)、k(x1,xn)、k(xn,x1)、k(xn,xn)均表示核函数;

38、当前输入的状态x*的均值μ(x*)和方差σ(x*)为:

39、

40、随机控制障碍函数通过使用传感器测量的高斯过程回归来近似,其中,μ(x)≥0表明状态x被推断为具有不确定性σ(x)的安全,反之亦然。

41、优选地,为了满足安全约束和不确定性约束,定义两个归零控制障碍函数:

42、h1(x)=μ(x)-d,

43、h2(x)=σ0-σ(x)

44、其中,d≥0用于分析概率安全保证。

45、优选地,通过定义的两个归零控制障碍函数,给定目标状态xg和相应的标称控制器k(x,xg),在三个约束条件的约束下,实现二次规划控制器为:

46、

47、s.t.μ(x)>0,

48、σ(x)≤σ0,

49、

50、

51、uminim≤u≤umaxim

52、其中,umin和umax分别是控制器输出的下限和上限;

53、求解次规划控制器获得机器人系统的控制输入,从而保证机器人在工作环境中的安全性和低不确定性。

54、与现有技术相比,本发明的有益效果为:本发明是一种噪声环境下基于cbf的安全关键控制算法,假定通过传感器真实的实时测量获取数据样本,生成训练数据集;在利用高斯回归模型学习未知环境的过程中,对均值函数和协方差函数提出了两个约束条件,保证了机器人的安全性,减少了测量噪声和环境极限观测带来的不确定性;最后,定义了两个cbf来满足上述约束,并实现二次规划控制,满足机器人的安全性,协方差被约束以满足低不确定性,最终可实现噪声环境下基于cbf的安全关键控制算法。

55、本发明还具有以下有益效果:

56、(1)、本发明提出的算法是未知环境,在已知环境中,机器人已经具备了相关的地图和环境信息,不需要进行探索;未知环境更符合实际情况,本发明能够使机器人能够更好地适应复杂和动态的未知环境,灵活性高。

57、(2)、本发明提出的算法具有低不确定性,机器人对环境和感知数据的理解更准确,可以减少机器人在未知环境中的风险和意外情况;当机器人在移动过程中能够准确预测环境的状况和变化,可以选择更安全的路径并避免潜在的危险。

58、(3)、本发明所提出随机cbf算法鲁棒性高,通过引入随机干扰,使机器人系统能够更好地应对不确定性和外部干扰,使系统在面对不确定性时更具适应性和可靠性。

本文地址:https://www.jishuxx.com/zhuanli/20240730/199949.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。