技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种联合多模型交互滤波和DNN的飞行器状态估计方法  >  正文

一种联合多模型交互滤波和DNN的飞行器状态估计方法

  • 国知局
  • 2024-11-25 15:18:23

本公开实施例涉及飞行器状态估计,尤其涉及一种联合多模型交互滤波和dnn的飞行器状态估计方法。

背景技术:

1、飞行器轨迹估计在提高飞行安全、提升飞行效率、支持复杂任务执行等方面都具有重要的意义,是航空航天领域的基础性工作之一。对于具有复杂机动形式的飞行器而言,其轨迹较一般飞行器更为复杂。目前的飞行器状态估计方法大多采用恒定速度(constantvelocity,cv)、恒定加速度(constant acceleration,ca)、匀速转弯(constant turn,ct)、singer 等模型描述目标机动,并基于扩展卡尔曼滤波(extended kalman filter,ekf)、无迹卡尔曼滤波(unscented kalman filter,ukf)等方法实现状态估计。面对此类具有复杂机动形式的飞行器轨迹估计问题时,受限于模型精度,传统的状态估计方法无法充分的适应飞行器复杂的运动模态,使得状态估计的精度较低。与传统的卡尔曼滤波方法相比,深度学习的方法状态估计精度上限更高,不受限于模型的精度,但是深度学习的方法存在一定的不稳定性,包括过拟合的问题。

2、因此,有必要改善上述相关技术方案中存在的一个或者多个问题。

3、需要注意的是,本部分旨在为权利要求书中陈述的本公开的技术方案提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。

技术实现思路

1、为了避免现有技术的不足之处,本技术提供一种联合多模型交互滤波和dnn的飞行器状态估计方法,用以解决现有技术中存在过拟合等不稳定的问题。

2、根据本公开实施例,提供一种联合多模型交互滤波和dnn的飞行器状态估计方法,该方法包括:

3、根据飞行器的状态变量确定若干个运动学模型,并根据若干个运动学模型建立若干个对应的传统运动学卡尔曼滤波器;其中,运动学模型包括匀速模型、匀加速模型和匀速转弯模型;

4、构建并训练lstm网络模型,并根据训练好的lstm网络模型构建lstm-kf滤波器;

5、构建交互式多模型滤波框架,并将所有传统运动学卡尔曼滤波器和lstm-kf滤波器添加至交互式多模型滤波框架中;

6、将历史位置信息输入至交互式多模型滤波框架中,遍历所有传统运动学卡尔曼滤波器和lstm-kf滤波器进行预测更新,计算并更新模型概率,通过加权计算得到最终的状态估计结果。

7、进一步地,状态变量包括:

8、飞行器的三轴位置、飞行器的三轴速度、飞行器的三轴加速度和飞行器的转弯率;其中,

9、匀速模型的状态变量为飞行器的三轴位置和飞行器的三轴速度,匀加速模型的状态变量为飞行器的三轴位置、飞行器的三轴速度和飞行器的三轴加速度,匀速转弯模型的状态变量包括飞行器的三轴位置、飞行器的三轴速度和飞行器的转弯率,lstm网络模型的状态变量为飞行器的三轴位置和飞行器的三轴速度。

10、进一步地,构建并训练lstm网络模型,并根据训练好的lstm网络模型构建lstm-kf滤波器的步骤中,包括:

11、获取飞行器的位置信息序列,将位置信息序列的前m帧作为输入、第m+1帧为真值,构成数据集;

12、将数据集按照预设比例划分为训练集和测试集;

13、构建lstm网络模型;

14、利用训练集训练lstm网络模型,并利用测试集测试训练后lstm网络模型,以得到训练好的lstm网络模型;

15、利用训练好的lstm网络模型的非线性函数代替状态转移矩阵进行状态的更新,构成lstm-kf滤波器。

16、进一步地,lstm网络模型的输入为历史轨迹时序信息,输出为当前时刻的位置预测值,即:

17、

18、其中,为时间步的lstm网络模型的预测值,为lstm网络模型的推断函数,为时间步的位置估计值,为时间步的位置估计值,为时间步的位置估计值;

19、lstm网络模型的具体结构为:

20、

21、

22、

23、

24、

25、

26、其中,为第t时刻的遗忘门的输出,为sigmoid激活函数,为作用于隐藏状态的权重矩阵,为作用于当前输入的权重矩阵,为第t-1时刻的隐藏状态,为第t时刻的隐藏状态,为每时刻网络的输入,为第t时刻的网络细胞状态,为遗忘门的偏置向量,为第t时刻的输入门的输出,为作用于隐藏状态的权重矩阵,为作用于输入的权重矩阵,为输入门的偏置向量,为第t时刻的输出门的输出,为作用于隐藏状态的权重矩阵,为作用于输入的权重矩阵,为输出门的偏置向量,为候选细胞状态,为tanh激活函数,为作用于当前输入的权重矩阵,为作用于输入的权重矩阵,为候选细胞状态的偏置向量,为第t-1时刻的网络细胞状态,表示元素乘。

27、进一步地,将历史位置信息输入至交互式多模型滤波框架中,遍历所有传统运动学卡尔曼滤波器和lstm-kf滤波器进行预测更新,计算并更新模型概率,通过加权计算得到最终的状态估计结果的步骤中,包括:

28、利用马尔可夫转移概率矩阵实现传统运动学卡尔曼滤波器与lstm-kf滤波器之间的模型交互,根据上一时刻每个传统运动学卡尔曼滤波器的状态估计和模型概率计算混合估计与协方差,将混合估计作为当前循环的初始状态;

29、将混合估计的结果输入到所有传统运动学卡尔曼滤波器与lstm-kf滤波器中进行预测和更新步骤;

30、根据每个传统运动学卡尔曼滤波器得到的预测状态结合观测值计算观测似然度,结合模型权重计算每个传统运动学卡尔曼滤波器的加权似然度,并计算所有加权似然度的总和作为归一化因子并更新模型概率;

31、基于模型概率,对每个传统运动学卡尔曼滤波器的估计结果加权合并,得到最终的状态估计和协方差估计。

32、进一步地,lstm-kf滤波器的预测步骤为:

33、

34、

35、其中,是对于的雅可比矩阵,是系统噪声矩阵,是时间步预测后的协方差矩阵;

36、lstm-kf滤波器的更新步骤为:

37、

38、

39、

40、其中,是卡尔曼增益,是观测矩阵,是观测噪声矩阵,是在时间步的观测值,是时间步的最终估计值,是时间步的协方差矩阵,是单元阵。

41、进一步地,马尔可夫转移概率矩阵为:

42、

43、其中,为马尔可夫转移概率矩阵。

44、进一步地,根据每个传统运动学卡尔曼滤波器得到的预测状态结合观测值计算观测似然度,结合模型权重计算每个传统运动学卡尔曼滤波器的加权似然度,并计算所有加权似然度的总和作为归一化因子并更新模型概率的步骤中,包括:

45、计算第 j个模型的似然函数:

46、

47、其中,为测量误差协方差矩阵,为测量误差;

48、计算归一化常数:

49、

50、其中,为融合后的模型可信度;

51、计算第 j个模型的更新模型概率:

52、

53、其中,为第k-1时刻的模型概率。

54、进一步地,基于模型概率,对每个传统运动学卡尔曼滤波器的估计结果加权合并,得到最终的状态估计和协方差估计的步骤,包括:

55、

56、

57、其中,为最终的状态估计结果,为第 j个模型第时刻的位置估计值,为更新后的马尔可夫转移概率矩阵,为第j个模型的协方差矩阵。

58、本公开的实施例提供的技术方案可以包括以下有益效果:

59、本公开的实施例中,通过上述联合多模型交互滤波和dnn的飞行器状态估计方法,一方面,根据采集的飞行器轨迹集对lstm网络模型进行训练,lstm-kf滤波器使用lstm网络模型构成的非线性函数代替原有的状态转移矩阵进行状态预测更新,并将lstm-kf滤波器作为一个滤波器模块接入到交互式多模型滤波框架。该方法存在多种不同的模型之间的交互,能够很好的适应飞行器的复杂运动模式,即使在飞行器运动模式发生跳变时仍然能够很好的适应,同时融合深度神经网络滤波器的结果,提升了飞行器状态估计精度的上限。另一方面,使用lstm-kf滤波器提高交互式多模型滤波器的精度上限,在某些时刻深度神经网络预测结果有偏差时能够及时切换到传统基于运动学的滤波器,保证了交互式多模型滤波器的系统性能。

本文地址:https://www.jishuxx.com/zhuanli/20241125/337260.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。