技术新讯 > 测量装置的制造及其应用技术 > 基于时空特征知识蒸馏的轻量级雷达目标识别方法  >  正文

基于时空特征知识蒸馏的轻量级雷达目标识别方法

  • 国知局
  • 2024-08-05 11:57:25

本发明涉及雷达目标识别领域,具体地,涉及一种基于时空特征知识蒸馏的轻量级雷达目标识别方法。

背景技术:

1、雷达因其全天候、全天时、作用距离远、实时性强等工作特点,在目标检测、跟踪和识别的各个环节中均发挥着不可替代的关键作用。雷达高分辨距离像(high-resolutionrange profile,hrrp)是高分辨雷达获取的目标散射点子回波在雷达射线方向上投影的矢量和,它能反映目标的结构特征。通过hrrp技术,雷达可以提取出目标在距离上的细微特征,例如目标的尺寸、形状,以及目标前沿的细微结构。因其具有易于获取、存储和处理的特点,被广泛应用于目标型号的识别任务,尤其是在军事侦察、飞机识别和导弹防御系统等应用领域。

2、近年来,随着深度学习技术的蓬勃发展,基于深度神经网络的雷达目标识别方法成为雷达技术领域的研究热点。为了提升目标识别的准确性,现有的网络通常设计较深的层数,以提升模型的表征能力。但也相应的带来了一些问题。神经网络的层数越多,计算成本和时间成本越高。在实际战场环境中,由于雷达终端设备的内存、算力等资源有限,使得拥有巨大的参数量和计算量的神经网络难以部署或者难以满足实时性要求。如何平衡模型识别率和模型复杂程度成为了雷达目标识别领域研究的重点。

技术实现思路

1、为了解决现有技术中存在的上述问题,本发明提供了一种基于时空特征知识蒸馏的轻量级雷达目标识别方法。

2、根据本发明实施例的第一方面,提供一种基于时空特征知识蒸馏的轻量级雷达目标识别方法,所述方法包括:

3、将待识别目标的雷达hrrp数据输入预先训练的学生模型;

4、预先训练的所述学生模型输出所述待识别目标的类别;其中,预先训练的所述学生模型为通过预先训练的教师模型、预先构建的时空特征转移模块和预先构建的多尺度特征提取模块对所述学生模型进行知识蒸馏后得到。

5、可选地,在所述将待识别目标的雷达hrrp数据输入预先训练的学生模型,得到所述待识别目标的类别之前,所述方法还包括:

6、将雷达hrrp训练集分别输入预先训练的所述教师模型和所述学生模型,得到所述教师模型的第一浅层特征图和第一深层特征图,所述学生模型的第二浅层特征图和第二深层特征图;

7、将所述第一浅层特征图输入预先构建的所述时空特征转移模块,得到时空特征图;

8、根据所述时空特征图和所述第二浅层特征图得到第一损失函数;

9、将所述第一深层特征图和所述第二深层特征图分别输入预先构建的所述多尺度特征提取模块,得到第一多尺度特征图和第二多尺度特征图;

10、根据所述第一多尺度特征图和所述第二多尺度特征图得到第二损失函数。

11、可选地,预先构建的所述时空特征转移模块包括:多头自注意力层、第一层归一化层、前馈层和第二层归一化层;所述多头自注意力层、所述第一层归一化层、所述前馈层和所述第二层归一化层依次连接;所述将所述第一浅层特征图输入预先构建的所述时空特征转移模块,得到时空特征图,包括:

12、利用正弦函数和余弦函数得到所述第一浅层特征图对应的位置编码;

13、根据所述位置编码和所述第一浅层特征图得到融合后的所述第一浅层特征图;

14、将融合后的所述第一浅层特征图输入所述多头自注意力层,得到多头注意力输出;

15、利用所述第一层归一化层和融合后的所述第一浅层特征图对所述多头注意力输出进行处理,得到处理后的所述多头注意力输出;

16、将处理后的所述多头注意力输出输入所述前馈层,得到前馈层输出;

17、利用所述第二层归一化层和处理后的所述多头注意力输出对所述前馈层输出进行处理,得到所述时空特征图。

18、可选地,所述位置编码如下所示:

19、

20、其中,p(l,k)表示所述第一浅层特征图中第l个通道的第k个特征对应的位置子编码,d为所述第一浅层特征图的特征维度,所述位置编码由每个通道的每个特征对应的位置子编码组成。

21、可选地,所述多头注意力输出如下所示:

22、fatt=concat(head1,…,headi)wo;

23、其中,fatt为所述多头注意力输出,表示第i个注意力头的输出,表示查询矩阵q对应的第i个线性映射矩阵,表示键矩阵k对应的第i个线性映射矩阵,表示值矩阵v对应的第i个线性映射矩阵,为预设的缩放因子,wo为总线性映射矩阵。

24、可选地,处理后的所述多头注意力输出如下所示:

25、

26、其中,fln为处理后的所述多头注意力输出,fp为融合后的所述第一浅层特征图,α和β为缩放和平移的参数向量,为均值,m为所述第一层归一化层中的神经元数量,为方差,ε为预设参数。

27、可选地,所述前馈层输出如下所示:

28、ffn(fln)=max(0,relu(flnw1+b1))w2+b2;

29、其中,ffn(fln)为所述前馈层输出,w1和w2为两个线性投影的参数矩阵,b1为w1的偏置,b2为w2的偏置。

30、可选地,预先构建的所述多尺度特征提取模块包括:多尺度卷积模块和通道注意力机制模块;所述将所述第一深层特征图和所述第二深层特征图分别输入预先构建的所述多尺度特征提取模块,得到第一多尺度特征图和第二多尺度特征图,包括:

31、根据所述第一深层特征图输入所述多尺度卷积模块进行多尺度卷积后得到多个第一单尺度特征图;

32、根据所述第二深层特征图输入所述多尺度卷积模块进行多尺度卷积后得到多个第二单尺度特征图;

33、将所述多个第一单尺度特征图和所述多个第二单尺度特征图分别进行通道维度的压缩,得到所述多个第一单尺度特征图对应的多个第一特征子图和所述多个第二单尺度特征图对应的多个第二特征子图;

34、利用所述通道注意力机制模块得到所述多个第一特征子图的多个第一特征权重和所述多个第二特征子图的多个第二特征权重;

35、对所述多个第一特征权重和所述多个第二特征权重分别进行归一化处理后,将归一化处理后的所述多个第一特征权重与对应的多个第一单尺度特征图进行点乘,得到多个第三特征图,并将归一化处理后的所述多个第二特征权重与对应的多个第二单尺度特征图进行点乘,得到多个第四特征图;

36、将所述多个第三特征图拼接得到所述第一多尺度特征图;

37、将所述多个第四特征图拼接得到所述第二多尺度特征图。可选地,所述第一单尺度特征图如下所示:

38、f'n=conv(1×kn,gn)(xn),n=0,1,…s-1;

39、其中,f'n表示第n个第一单尺度特征图,s为所述第一特征子图的数量,kn为第n个第一单尺度特征图对应的卷积核的大小,kn=2×(n+1)+1,gn为第n个第一单尺度特征图对应的卷积核自适应选择的组的大小,xn为第n个第一深层特征图。

40、可选地,所述方法还包括:

41、根据所述学生模型输出的所述待识别目标的类别与类别标签,得到第三损失函数;其中,所述类别标签中包含所述待识别目标的真实类别;

42、将所述待识别目标的雷达hrrp数据输入预先训练的所述教师模型,得到预先训练的所述教师模型输出的所述待识别目标的软目标;其中,所述待识别目标的软目标包含所述待识别目标的类别的概率分布;

43、根据所述学生模型输出的所述待识别目标的软目标与预先训练的所述教师模型输出的所述待识别目标的软目标,得到第四损失函数;

44、根据所述第一损失函数、所述第二损失函数、所述第三损失函数和所述第四损失函数对所述学生模型的参数进行调整,得到预先训练的所述学生模型。

45、本发明的实施例提供的技术方案可以包括以下有益效果:

46、在上述技术方案中,将待识别目标的雷达hrrp数据输入预先训练的学生模型;预先训练的所述学生模型输出所述待识别目标的类别;其中,预先训练的所述学生模型为通过预先训练的教师模型、预先构建的时空特征转移模块和预先构建的多尺度特征提取模块对所述学生模型进行知识蒸馏后得到。通过上述技术方案,利用知识蒸馏,通过结构复杂、网络性能较好的预先训练的教师模型对参数量较小的学生模型进行指导学习,能够有效提高学生模型的识别性能和泛化能力。并且,利用预先构建的时空特征转移模块提取待识别目标的雷达hrrp数据的时序特征和空间特征,利用丰富的特征信息,进一步提高蒸馏性能,并通过预先构建的多尺度特征提取模块获取并利用多个尺度的特征图的空间信息,丰富特征空间,在节约计算成本和时间成本的基础上,具有较高的目标识别准确率和实时性。

47、本发明的其他特征和优点将在随后的具体实施方式部分予以详细说明。

本文地址:https://www.jishuxx.com/zhuanli/20240802/260281.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。