基于注意力蒸馏的雷达工作模式类增量识别方法
- 国知局
- 2024-07-31 23:01:54
本发明属于雷达工作模式识别,具体涉及一种基于注意力蒸馏的雷达工作模式类增量识别方法。
背景技术:
1、随着电子信息、微电子和博弈论等技术的快速发展,雷达逐渐从单一功能转变为多功能、多任务的雷达系统。多功能雷达(multifunction radar,mfr)具有波束敏捷变化、波形和时序任务调度复杂等特点,可以根据任务需求和外部环境因素自适应地调度策略,以便得到更好的探测结果。然而,多功能雷达的上述特点使得侦察机从侦察脉冲参数反演得到其工作模式和任务意图变得尤为困难,进而严重影响了战场态势威胁评估。
2、针对多功能雷达工作模式识别的课题,相关学者已经开展了大量的工作。当前的多功能雷达工作模式识别任务模型多针对静态闭集模式数据样本,不具备针对新模式新样本的更新能力,无法持续学习复杂多变的未知雷达工作模式,难以适应动态增量观测场景,导致对战场环境的信息控制能力减弱。基于开集的增量学习识别算法为解决该问题提供了全新的思路,它是指在有限的内存资源限制下,通过数据流学习,使得模型具备终身学习的能力。
3、然而,直接使用新数据更新模型会产生灾难性遗忘——即模型学习了新类别同时遗忘了旧类别,失去对旧类别的判别能力,从而导致模型分类准确率的下降。灾难性遗忘问题主要是由于深度学习网络结构所导致的,是无法彻底解决,目前只能通过各种算法来进行缓解。深度神经网络是由网络参数与网络结构两部分决定,这两方面均会造成灾难性遗忘。首先是网络参数方面,在训练新任务时,网络参数的更新可能导致之前学习的知识被遗忘。另一方面,当网络结构过于复杂时,可能会导致模型在学习新任务时过度拟合新数据,从而忘记之前学习的知识。一些传统的神经网络结构可能缺乏记忆机制,无法有效地存储和保留之前学习的知识。如果网络结构无法适应不同任务或数据分布的变化,可能会导致在学习新任务时忘记之前学习的知识。
4、综上,传统的多功能雷达工作模式识别方法大多针对静态观测场景,任务模型不具备持续学习未知模式的能力,难以有效适应动态增量观测场景,无法更好的适应复杂多变的战场环境。而直接使用新数据更新模型会产生灾难性遗忘,失去对旧类别的识别能力,从而导致模型分类准确率的下降。因此,如何能够让模型具备学习新类别,同时降低对旧类别的灾难性遗忘是当前类增量学习问题的研究难点。
技术实现思路
1、为了解决现有技术中存在的上述问题,本发明提供了一种基于注意力蒸馏的雷达工作模式类增量识别方法。本发明要解决的技术问题通过以下技术方案实现:
2、本发明提出了一种基于注意力蒸馏的雷达工作模式类增量识别方法,包括:
3、从上一阶段的旧训练集中选取若干个旧训练样本构成范例集,并将所述范例集与新训练样本一起构成当前阶段的训练集;
4、将所述训练集输入到预先构建的雷达工作模式类增量识别网络中,基于注意力蒸馏的类增量学习,对所述雷达工作模式类增量识别网络进行训练,以便于利用训练好的网络进行当前阶段的雷达工作模式识别;
5、其中,所述雷达工作模式类增量识别网络包括并行注意力-时序特征感知原型神经网络和距离分类器,所述并行注意力-时序特征感知原型神经网络用于对输入数据进行特征提取,得到特征向量;所述距离分类器用于对所述特征向量进行分类,得到雷达工作模式识别结果。
6、本发明的有益效果:
7、本发明提供的基于注意力蒸馏的雷达工作模式类增量识别方法一方面借鉴难例挖掘的思想,从上一阶段的旧训练样本中选取范例集,以与新训练样本一起构成当前阶段的训练集,以对网络进行训练;另一方面,在训练过程中,引入了基于注意力蒸馏的类增量学习算法,通过对特征向量和中间层的特征图进行知识蒸馏,极大程度的缓解了新模型对旧类别的灾难性遗忘。该方法能够不断用新样本更新已有模型,从而使得新模型在不遗忘旧类别的基础上,还可以对新类别持续学习,使得雷达工作模式类增量识别网络在不遗忘旧类别的基础上还具备持续学习新类别的能力,从而提升了侦察机的行为感知效能,对提升我方侦察对抗能力有很强的现实意义。
8、以下将结合附图及实施例对本发明做进一步详细说明。
技术特征:1.一种基于注意力蒸馏的雷达工作模式类增量识别方法,其特征在于,包括:
2.根据权利要求1所述的基于注意力蒸馏的雷达工作模式类增量识别方法,其特征在于,从上一阶段的旧训练集中选取若干个旧训练样本构成范例集,具体包括:
3.根据权利要求2所述的基于注意力蒸馏的雷达工作模式类增量识别方法,其特征在于,基于注意力蒸馏的类增量学习,对所述雷达工作模式类增量识别网络进行训练,具体包括:
4.根据权利要求3所述的基于注意力蒸馏的雷达工作模式类增量识别方法,其特征在于,所述mdce损失的计算公式为:
5.根据权利要求3所述的基于注意力蒸馏的雷达工作模式类增量识别方法,其特征在于,所述mpl损失的计算公式为:
6.根据权利要求3所述的基于注意力蒸馏的雷达工作模式类增量识别方法,其特征在于,所述知识蒸馏损失的计算公式为:
7.根据权利要求3所述的基于注意力蒸馏的雷达工作模式类增量识别方法,其特征在于,所述注意力蒸馏损失的计算公式为:
8.根据权利要求3所述的基于注意力蒸馏的雷达工作模式类增量识别方法,其特征在于,所述联合损失函数的计算公式为:
9.根据权利要求1所述的基于注意力蒸馏的雷达工作模式类增量识别方法,其特征在于,在完成雷达工作模式类增量识别网络的训练之后,还包括:
10.根据权利要求9所述的基于注意力蒸馏的雷达工作模式类增量识别方法,其特征在于,在对所述雷达工作模式类增量识别网络进行测试时,通过特征空间中当前阶段测试集的分布与当前阶段训练集对应的类原型的距离得到预测结果,预测标签的公式为:
技术总结本发明公开了一种基于注意力蒸馏的雷达工作模式类增量识别方法,包括:从上一阶段的旧训练集中选取若干个旧训练样本构成范例集,并将范例集与新训练样本一起构成当前阶段的训练集;将训练集输入到预先构建的雷达工作模式类增量识别网络中,基于注意力蒸馏的类增量学习,对雷达工作模式类增量识别网络进行训练,以便于利用训练好的网络进行当前阶段的雷达工作模式识别;其中,雷达工作模式类增量识别网络包括并行注意力‑时序特征感知原型神经网络和距离分类器。该方法能够不断用新样本更新已有旧模型,同时,引入的基于注意力蒸馏的类增量学习算法可以缓解新模型对旧类别的灾难性遗忘,使得模型在不遗忘旧类别的基础上能够持续学习新类别。技术研发人员:周峰,田甜,宋相文,徐超,樊伟伟,石晓然受保护的技术使用者:西安电子科技大学技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/195689.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表