一种信息缺失下的制导信息协同估计方法与流程
- 国知局
- 2024-07-31 23:10:06
本发明属于制导信息,尤其涉及一种信息缺失下的制导信息协同估计方法。背景技术:::1、在设计多弹协同末制导律时,基于多智能体一致性理论进行了构建。需要强调的是,这一制导律的提出是以弹目距离、接近速度等制导信息已知为前提的。然而,安装红外导引头的导弹仅能测得目标相对于导弹的角度,这限制了制导信息的完整获取。因此,为了弥补这一信息缺失,提出了利用多枚导弹对目标进行协同估计的策略。2、为了深入研究制导信息的协同估计,采用了扩展卡尔曼滤波算法。首先,根据扩展卡尔曼滤波的原理,构建了协同估计状态方程;其次,通过分析弹目之间的空间几何关系,解算出弹目距离,进而完成量测方程的构建。3、然而,扩展卡尔曼滤波算法(ekf)的性能对其关键参数的设置极为敏感,特别是过程噪声协方差矩阵q和观测噪声协方差矩阵r。在实际应用中,由于这些参数的准确值难以获取,往往只能通过多次调试得到一个经验值,并在整个状态估计过程中采用这一固定值。噪声协方差矩阵的真实值与经验值之间往往存在差异,且这种差异可能会随环境、观测设备等因素的变化而变化,这将对跟踪结果的稳定性造成不利影响,甚至可能导致滤波器发散。4、为了解决这一问题,亟需提出利用强化学习的手段来校正过程噪声协方差矩阵q和观测噪声协方差矩阵r,以获得更准确的量测效果。技术实现思路1、本发明的目的在于提出一种信息缺失下的制导信息协同估计方法,基于多枚导弹与目标在空间中的位置关系,运用扩展卡尔曼滤波算法,实现了对制导信息的高精度估计;同时,为进一步优化量测效果,还采用强化学习的方法,对过程噪声协方差矩阵q和观测噪声协方差矩阵r进行校正,从而提高了对目标的估计准确度;为现代战场环境下多弹协同作战提供了有力的技术支持和理论保障。2、为实现上述目的,本发明提供了一种信息缺失下的制导信息协同估计方法,包括:3、构建含缺失信息的多弹协同的状态估计模型;其中,所述缺失信息为导弹在制导过程中所用到的距离信息;4、根据专家系统确定过程噪声和观测噪声的参数;5、结合专家系统确定的过程噪声和观测噪声的参数,利用扩展卡尔曼滤波方法对状态估计模型中所述缺失信息进行多弹协同估计,并在多弹协同估计过程中,使用强化学习方法动态调节专家系统确定的过程噪声和观测噪声的参数。6、可选地,所述状态估计模型包括:滤波器状态方程和量测方程;7、所述滤波器状态方程为:8、9、其中,为导弹运动状态的导数,为过程噪声,为过程噪声矩阵;10、所述量测方程为:11、12、其中,<mstyledisplaystyle="true"mathcolor="#000000"><msub><mi>v</mi><mrow><mn>2</mn><mi>,</mi><mi>i</mi></mrow></msub><mi>=</mi><msup><mrow><mo>[</mo><mtable><mtr><mtd><mtable><mtr><mtd><msub><mi>r</mi><mi>i</mi></msub></mtd><mtd><msub><mi>v</mi><mrow><mi>ε</mi><mi>,</mi><mi>i</mi></mrow></msub></mtd></mtr></mtable></mtd><mtd><msub><mi>v</mi><mrow><mi>β</mi><mi>,</mi><mi>i</mi></mrow></msub></mtd></mtr></mtable><mo>]</mo></mrow><mi>t</mi></msup></mstyle>表示弹目距离、视线角的量测噪声。13、可选地,所述过程噪声和观测噪声的参数为:14、15、其中,为跟据专家系统确定的过程噪声和观测噪声的表达式,为系统状态,为待设计参数。16、可选地,所述弹目距离的量测噪声为:17、18、19、20、21、其中,、、分别为参考坐标系(地面坐标系)各对应轴的单位矢量,空间矢量的单位矢量为,的单位矢量为,的单位矢量为,的单位矢量为。22、可选地,对状态估计模型中所述缺失信息进行多弹协同估计包括:23、对所述状态估计模型进行线性化处理;24、对线性化处理后的所述状态估计模型进行离散化处理。25、可选地,所述线性化处理的表达式为:26、27、其中,为的导数,为系统状态矩阵,为系统状态,为噪声矩阵,为过程噪声;28、所述离散化处理的表达式为:29、30、其中,为估计模型的状态,为过程噪声,为过程噪声矩阵,为状态转移矩阵,为量测信息,为量测噪声矩阵,为测量噪声矩阵。31、可选地,使用强化学习方法动态调节专家系统确定的过程噪声和观测噪声的参数包括:32、初始化所述状态估计模型:随机初始化状态值,按照专家系统设定、序列和状态估计协方差矩阵的值;33、初始化强化学习算法:给定学习率、折扣因子;34、基于初始化后的所述状态估计模型和强化学习算法,进行动态调节专家系统确定的过程噪声和观测噪声的参数。35、可选地,基于初始化后的所述状态估计模型和强化学习算法,进行动态调节专家系统确定的过程噪声和观测噪声的参数包括:36、1)根据当前状态选择动作值;其中,所述当前状态为过程噪声和观测噪声,所述动作值用于对过程噪声和观测噪声进行校正;37、2)执行动作,并执行次步骤3)—7);其中,表示迭代次数,需提前给定;38、3)计算先验估计值:39、,其中,表示系统状态,表示采样时刻,表示系统状态矩阵;40、4)计算状态估计协方差矩阵预测值:41、,其中,表示协方差矩阵,表示过程噪声矩阵,表示过程噪声协方差矩阵;42、5)计算卡尔曼增益矩阵k:43、,44、其中,表示量测噪声矩阵,表示增益矩阵;45、6)计算后验估计值:46、<mstyledisplaystyle="true"mathcolor="#000000"><moveraccent="true"><mi>x</mi><mo>^</mo></mover><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mi>=</mi><msup><moveraccent="true"><mi>x</mi><mo>^</mo></mover><mi>−</mi></msup><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mo>+</mo><mi>k</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mrow><mo>[</mo><mrow><mi>y</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mi>−</mi><mi>h</mi><msup><moveraccent="true"><mi>x</mi><mo>^</mo></mover><mi>−</mi></msup><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mrow><mo>]</mo></mrow></mstyle>47、其中,表示滤波器增益,表示观测输出;48、7)更新状态估计协方差矩阵:49、<mstyledisplaystyle="true"mathcolor="#000000"><mi>p</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mi>=</mi><mrow><mo>[</mo><mrow><mi>i</mi><mi>−</mi><mi>k</mi><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow><mi>h</mi></mrow><mo>]</mo></mrow><msup><mi>p</mi><mi>−</mi></msup><mrow><mo>(</mo><mi>k</mi><mo>)</mo></mrow></mstyle>50、8)观测下一时刻状态,计算新息序列并计算奖励值;51、9)根据四元组(,,,)对强化学习的智能体进行更新;52、10)当k=k+1时,转到步骤1);k表示离散的时刻;53、在每回合结束后,根据当前策略选出最优的过程噪声协方差矩阵q和观测噪声协方差矩阵r值,送入所述状态估计模型进行目标跟踪。54、可选地,计算所述奖励值的方法为55、56、其中,表示回合奖励值,为滤波器的新息序列,是其转置,为搜索滤波器的新息序列,是其转置,表示回合的累积奖励值。57、本发明具有以下有益效果:58、本发明首先构建含缺失信息的多弹协同的状态估计模型;再根据专家系统确定过程噪声和观测噪声的参数;然后利用扩展卡尔曼滤波方法对状态估计模型中所述缺失信息进行多弹协同估计,并在多弹协同估计过程中,使用强化学习方法动态调节专家系统确定的过程噪声和观测噪声的参数。本发明运用扩展卡尔曼滤波算法,实现了对制导信息的高精度估计;同时,为进一步优化量测效果,还采用强化学习的方法,对过程噪声协方差矩阵q和观测噪声协方差矩阵r进行校正,从而提高了对目标的估计准确度;为现代战场环境下多弹协同作战提供了有力的技术支持和理论保障。当前第1页12当前第1页12
本文地址:https://www.jishuxx.com/zhuanli/20240730/196196.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。