技术新讯 > 控制调节装置的制造及其应用技术 > 基于预测器的固定时间神经网络航天器姿态控制方法  >  正文

基于预测器的固定时间神经网络航天器姿态控制方法

  • 国知局
  • 2024-07-31 23:30:25

本发明涉及一种基于预测器的固定时间神经网络航天器姿态控制方法,属于航天器姿态控制领域。

背景技术:

1、航天器姿态跟踪控制旨在控制航天器在三维空间中跟踪特定姿态,以确保其可以在动态环境中追踪目标轨迹,对于航天器的精确导航、轨道调整和目标对准至关重要。在执行实际任务时,航天器会受到多种不确定性和外部扰动的干扰,例如大气摩擦、质心偏移、外部引力等,这些因素会影响航天器跟踪控制的精度。

2、为了更好的估计并抑制多种不确定性与外部扰动的影响,2018年在ieeetrans.neural netw.learn.syst.【神经网络学习系统期刊】发表了“neuro-adaptivecontrol with given performance specifications for strict feedback systemsunder full-state constraints”一文,使用神经网络构建估计器从而估计系统中的不确定性实现了全状态约束条件下的跟踪控制。但该技术方案无法对航天器的姿态跟踪速度进行调整,在某些应用场合下可能无法满足对响应速度的要求。

3、为了提高航天器的姿态跟踪控制的响应速度,2021年在ieeetrans.ind.electron【工业电子期刊】发表了“neural network based finite-timeattitude tracking control of spacecraft with angular velocity sensor failuresand actuator saturation”一文,通过引入有限时间控制来确保航天器姿态可以在有限时间内实现跟踪。然而,在有限时间控制方法中,设计收敛时间依赖于状态的初始值,在初始值未知的情况下无法确定收敛时间。

4、为了避免时间控制中对状态初始值的依赖,2022年在ieee trans.cybern.【控制理论期刊】发表了“fixed-time fuzzy control for a class of nonlinear systems”一文,设计了一种基于反步法的固定时间模糊控制算法,该技术方案摆脱了有限时间控制中对初始值的依赖,收敛时间的计算只取决于设计参数。但传统反步法可能会导致微分爆炸问题,导致计算负担大幅增加并且降低系统稳定性。

技术实现思路

1、为了解决传统反步法引起的微分爆炸问题,提高跟踪控制响应速度的同时避免有限时间控制对初始状态值的依赖,本发明公开一种基于预测器的固定时间神经网络航天器姿态控制方法,要解决的技术问题是:提供一种针对受未知不确定性和外部干扰影响的非线性航天器的姿态跟踪控制方法,在避免微分爆炸的前提下,实现航天器对给定参考姿态的跟踪控制并对不确定性与外部干扰进行有效抑制,提高航天器控制响应速度与精度。

2、本发明的目的是通过下述技术方案实现的:

3、本发明公开的一种基于预测器的固定时间神经网络航天器姿态控制方法,控制对象是受未知不确定性和外部干扰影响的非线性航天器。根据航天器俯仰角运动方程、反作用轮动力学方程、反作用轮电子特性方程构建由反作用轮控制的不确定航天器俯仰角运动系统模型。之后构建一种状态预测器,对航天器俯仰角运动系统状态进行预测,将状态预测误差信号而非实际状态误差信号引入神经网络使得神经网络估计器与控制器的耦合程度降低,提高估计器在估计不确定性时的学习稳定性和估计精度,进一步抑制不确定性和外部干扰的影响。同时在神经网络估计器中加入自适应鲁棒项,对估计误差的上界进行自适应估计与补偿,进一步提高估计精度。在此基础上,基于反步法框架设计控制器,构建一个固定时间滤波器计算反步法中虚拟控制信号的导数估计值从而解决微分爆炸的问题,基于滤波器对虚拟控制量的估计误差和当前阶补偿信号而非更高阶补偿信号构建固定时间补偿系统,在降低补偿系统阶次并且减少耦合的同时进一步提高控制器控制精度。

4、本发明公开的一种基于预测器的固定时间神经网络航天器姿态控制方法,包括如下步骤:

5、步骤一:构建航天器俯仰角运动方程、反作用轮动力学方程、反作用轮电子特性方程。基于该三个方程构建由反作用轮控制的不确定航天器俯仰角运动系统模型,并将航天器俯仰角运动系统模型转化为严格反馈系统的形式。

6、三通道低轨道航天器姿态运动方程可表示为:

7、

8、其中js=diag(jx,jy,jz)表示航天器惯性参数,jx,jy,jz分别表示横滚轴、俯仰轴和偏航轴的转动惯量,τ=[φ,θ,ψ]t,φ,θ,ψ分别表示航天器的横滚角、俯仰角、偏航角,δ∈r3×n为弹性结构与刚体之间的耦合矩阵,td=[dx,dy,dz]t为外部干扰,tu=[u1,u2,u3]t为控制力矩。在上述三通道姿态方程中,俯仰通道与其他通道无关,横滚和偏航通道是耦合的。因此,俯仰运动方程等效为:

9、

10、其中n表示航天器的在轨速率,j代表反作用轮的转动惯量,ω表示反作用轮的转速。

11、在俯仰通道控制方面,根据角动量守恒定律得到反作用轮动力学方程为:

12、

13、其中dω表示反作用轮产生的摩擦力矩,其形式为dω=r1[tanh(s1ω)-tanh(s2ω)]+r2tanh(s3ω)+r2ω+r3sin(t),其中s1,s2,s3,r1,r2,r3是正常数,输入扭矩t可表示为:

14、t=-kvia   (4)

15、其中kv表示电磁力矩系数,ia表示电枢电流。因此,扭矩t和反作用轮的转速ω可以用电流ia表示。

16、反作用轮电子特性方程表示为:

17、

18、其中l表示电枢电感,ra表示电枢电阻,ua表示电枢电压,ke表示反emf系数。

19、基于航天器俯仰角运动方程、反作用轮动力学方程、反作用轮电子特性方程可以得到由反作用轮控制的不确定航天器俯仰角运动系统模型如式(6)所示:

20、

21、取航天器俯仰角运动系统状态x1=θ,x3=ia,令可将上述航天器俯仰角运动系统模型转化为严格反馈系统形式如式(7)所示:

22、

23、步骤二:构建状态预测器对航天器俯仰角运动系统状态进行预测,以预测器的预测误差作为固定时间神经网络估计器的输入对状态中所含的不确定性进行估计,同时在神经网络估计器中加入自适应鲁棒项以补偿最小学习误差,提高估计精度。

24、对于步骤一中的航天器俯仰角运动系统,构建状态预测器如下:

25、

26、

27、

28、其中ki1,ki2(i=1,...,3)为可设计参数,需满足ki1>0.5,ki2>0。是神经网络理想权重向量的估计值,为核函数,选为有界高斯函数。是预测误差信号满足

29、通过构建如式(11)所示固定时间神经网络估计器,估计各阶状态中的不确定性与外部干扰:

30、

31、其中μi是神经网络估计误差的上限,构建μi的估计信号如下:

32、

33、其中ki6,ki7,ki8设计为正参数。如式(12)所示的自适应律用于实现对神经网络估计器估计误差上限的自适应估计。在神经网络估计器(11)中引入有界信号对神经网络估计器对不确定性的估计误差进行补偿,进一步提高估计精度。

34、基于预测误差信号构建神经网络权重的学习更新律如式(13)所示,从而实现自适应的权重更新:

35、

36、其中ki3、ki4、ki5设计为正参数,l是神经网络的节点数。

37、通过构建分段连续函数避免状态预测器(8)-(10)产生奇异性问题,提高预测过程的稳定性:

38、

39、其中γf,i设计为正参数。

40、构建李雅普诺夫函数v1i如式(15),对状态预测误差信号神经网络权重误差神经网络估计误差上限的估计误差信号进行李雅普诺夫稳定性分析确保其渐进稳定性:

41、

42、其中表示向量的第j个元素。

43、对v1i进行求导得到:

44、

45、

46、

47、其中△wi是正常数。

48、对于利用杨不等式得到如式(19)所示的不等式:

49、

50、对于利用杨不等式得到如式(20)所示的不等式:

51、

52、其中△μi是正常数。

53、基于上述不等式(17)-(20),将关于的不等式整理为:

54、

55、

56、根据的定义,当时,将关于的不等式整理为:

57、

58、其中,m1i=min{23/4ki2,ki5(2ki3)3/4/8,ki7(2ki6)3/4/8},

59、当且β1i满足0<β1i<1时,满足以下不等式:

60、

61、根据李雅普诺夫理论与固定时间控制理论,得到v1i会在固定时间t1i<4/m1i+1/(m2i(1-β1i))内收敛到

62、当时,将关于的不等式整理为:

63、

64、根据李雅普诺夫理论与固定时间控制理论,得到v1i会在固定时间t1i<4/m1i+1/(m2i(1-β1i))内收敛到

65、根据v1i的定义得到关于的不等式如下:

66、

67、

68、

69、根据固定时间神经网络估计器的定义得到关于的等式:

70、

71、基于tanh函数的性质,得到关于的不等式:

72、

73、满足以下不等式:

74、

75、基于上述关于和的不等式,关于的不等式可以进一步改写为:

76、

77、根据式(25)(26)(27)(31),表明以及在固定时间内会收敛到一个原点附近的邻域。

78、步骤三:基于步骤二得到的估计信息,以反步法为框架对前两阶状态x1,x2分别构建虚拟控制信号,并构建固定时间滤波器对虚拟控制信号的导数进行估计。基于固定时间滤波器对虚拟控制量的估计误差和当前阶补偿信号而非更高阶补偿信号构建固定时间补偿系统,在降低补偿系统阶次并且减少耦合的同时进一步提高对航天器俯仰角的控制精度。基于李雅普诺夫理论,针对第三阶状态x3设计用于控制航天器俯仰角的实际控制律,提高对航天器俯仰角的控制精度。

79、定义输出跟踪误差信号e1和虚拟控制量误差e2,e3为:

80、e1=x1-yd+p1tanh(μ1)  (32)

81、e2=x2-α2f+p2tanh(μ2)  (33)

82、e3=x3-α3f  (34)

83、其中yd是时变参考信号,p1,p2设计为正参数,μ1,μ2是误差补偿信号。

84、通过设计如式(35)所示的固定时间滤波器估计虚拟控制量的导数,解决反步法设计可能导致的微分爆炸问题,降低运算负担:

85、

86、其中τi1,τi2,τi3设计为正参数。通过设计分段连续函数ση,i(ηi)如式(36)所示,避免固定时间滤波器(35)产生奇异性问题,提高控制过程的稳定性:

87、

88、其中γη,i设计为正参数。ηi是滤波误差信号,其定义如式(37)所示:

89、ηi=αif-αi-1,i=2,3  (37)

90、误差补偿信号μi的自适应律设计为:

91、

92、其中δi1,δi2,δi3设计为正参数。通过设计分段连续函数σμ,i(μi)如式(39)所示,避免误差补偿信号μi产生奇异性问题,提高控制过程的稳定性:

93、

94、针对第一阶状态x1选取李雅普诺夫函数为:

95、

96、对v2,1进行微分,得到:

97、

98、根据式(41)与李雅普诺夫理论设计虚拟控制量α1为:

99、

100、其中χ11,χ12,χ13设计为正参数。通过设计分段连续函数σe,1(e1)如式(43)所示,避免虚拟控制量α1产生奇异性问题,提高控制过程的稳定性:

101、

102、其中γe,1设计为正参数。

103、基于不等式-p2<p2tanh(μ2)<p2与杨氏不等式,得到如式(44)所示的不等式:

104、

105、基于式(41)-(44),得到关于v2,1的不等式:

106、

107、针对第二阶状态x2设计虚拟控制量,选取李雅普诺夫函数为:

108、

109、对v2,2进行微分得到:

110、

111、根据式(47)与李雅普诺夫理论设计虚拟控制量α2为:

112、

113、其中χ21,χ22,χ23设计为正参数。通过设计分段连续函数σe,2(e2)如式(49)所示,避免虚拟控制量α2产生奇异性问题,提高控制过程的稳定性:

114、

115、其中γe,2设计为正参数。

116、基于式(47)-(49),得到关于v2,2的不等式:

117、

118、针对第三阶状态x3设计实际控制量,选取李雅普诺夫函数为:

119、

120、对v2,3进行微分得到:

121、

122、根据式(52)与李雅普诺夫理论设计实际控制量为:

123、

124、其中χ31,χ32,χ33设计为正参数。通过设计分段连续函数σe,3(e3)如式(54)所示,避免实际控制量u产生奇异性问题,提高控制过程的稳定性:

125、

126、其中γe,3设计为正参数。

127、基于式(52)-(54),得到关于v2,3的不等式:

128、

129、设计李雅普诺夫函数v2如下:

130、v2=v2,1+v2,2+v2,3  (56)

131、对v2进行微分,得到不等式:

132、

133、

134、根据李雅普诺夫理论与固定时间控制理论,得到v2会在固定时间t2<4/n1+1/(n2(1-β2))内收敛到

135、根据v2的定义得到关于ei的不等式如下:

136、

137、根据式(35)-(39)(42)(43)(48)(49)与李雅普诺夫理论设计李雅普诺夫函数v3如下:

138、

139、对v3进行微分,得到不等式:

140、

141、其中l1=min{τi+1,123/4,δi123/4/pi},l2=41/4min{4τi+1,2,4δi2/pi},κi和ζi定义如下:

142、

143、

144、根据李雅普诺夫理论与固定时间控制理论,得到v3会在固定时间t3<4/l1+1/(l2(1-β3))内收敛到其中0<β3<1。

145、根据v3的定义得到关于ηi,μi的不等式如下:

146、

147、

148、根据李雅普诺夫理论与式(59)(64)(65),表明ei,μi以及ηi在固定时间内会收敛到一个原点附近的邻域,满足李雅普诺夫稳定,即用于控制航天器俯仰角的实际控制律能够实现对航天器俯仰角的跟踪控制且提高控制精度。

149、有益效果:

150、1、以往的神经网络估计器利用跟踪误差来更新神经网络权值,当控制参数和初始状态选择不当时,会导致意外振荡。本发明公开的一种基于预测器的固定时间神经网络航天器姿态控制方法,提出了一种基于自适应预测器的固定时间神经网络估计器。与以往的神经网络估计器相比,该估计器将状态预测误差信号而非实际状态误差信号作为神经网络的输入从而分离神经网络估计器与控制器,提高估计器的在估计不确定性时的学习稳定性和估计精度。同时在在神经网络估计器中加入自适应鲁棒项,对估计误差的上界进行自适应估计与补偿,进一步提高估计精度。

151、2、传统反步法在应用时存在微分爆炸问题,此外以往指令滤波反步法存在补偿系统阶数较高、各阶补偿系统相互耦合的问题。本发明公开的一种基于预测器的固定时间神经网络航天器姿态控制方法,基于反步法框架设计控制器,构建一个固定时间滤波器计算反步法中虚拟控制信号的导数估计值从而有效解决微分爆炸的问题。与以往的指令滤波反步法不同,引入了一个有界补偿信号来处理滤波误差,基于固定时间滤波器对虚拟控制量的估计误差和当前阶补偿信号而非更高阶补偿信号构建新的固定时间补偿系统,在降低补偿系统阶次并且减少耦合的同时进一步提高对航天器俯仰角的控制精度,提高控制器的可实施性。

152、3、在过去的有限时间控制方法中,设计收敛时间依赖于状态的初始值,在初始值未知的情况下无法确定收敛时间。本发明公开的一种基于预测器的固定时间神经网络航天器姿态控制方法,通过在状态预测器、神经网络估计器、虚拟控制器、估计虚拟控制量导数的滤波器、实际控制器中加入非线性项,使得在系统状态远离平衡点时,状态预测器、神经网络估计器、虚拟控制量、固定时间滤波器、实际控制器的输出幅值变化更快,在无需已知初始状态的情况下即可确定收敛时间,摆脱以往有限时间控制方法对初始条件的约束,同时提高控制方法的响应速度,以确保误差在固定时间内收敛到原点附近的邻域。

153、4、本发明公开的一种基于预测器的固定时间神经网络航天器姿态控制方法,通过在状态预测器、神经网络估计器、虚拟控制量、固定时间滤波器、实际控制量中引入分段连续控制函数,有效避免奇异性问题,保证控制过程的鲁棒性。

本文地址:https://www.jishuxx.com/zhuanli/20240730/197815.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。