技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于阶梯交互注意力和像素特征增强网络红外小目标检测方法  >  正文

一种基于阶梯交互注意力和像素特征增强网络红外小目标检测方法

  • 国知局
  • 2024-07-31 22:38:46

本发明涉及红外小目标检测领域,尤其涉及一种基于阶梯交互注意力和像素特征增强网络红外小目标检测方法。

背景技术:

1、红外小目标检测在交通监控、海上救援、目标预警等复杂的小目标分离中发挥着重要作用场景背景是必需的。场景动态特性带来的挑战在单帧红外小目标检测中引起了相当多的研究关注。该方向的早期方法采用图像滤波,人类视觉系统,和低秩近似技术,同时依赖于复杂的手工特征设计,经验观察和模型参数微调。然而,由于缺乏对整体场景的可靠的高层次理解,这些方法表现出较差的鲁棒性。最近,基于学习的方法由于其强大的数据驱动特征挖掘能力而变得越来越流行,其中u型神经网络结构得到了突出的应用。这些网络由编码器、解码器和远程跳过连接组成。随后,特征融合策略在红外小目标检测任务中被广泛采用。最近的一些方法通过改进跳过连接来促进将有益特征转移到解码器组件。

2、尽管取得了令人满意的结果,但上述基于cnns的方法缺乏对目标的综合属性进行编码的能力,失去了它们的判别特征;首先,红外小目标体积小而表现出有限的特征,多次降采样过程中不可避免地会导致空间信息的丢失。这在很大程度上影响了网络中层与层之间的特征交互,最终导致对全局语义信息的编码能力不足;其次,简单的跳过链接和密集的嵌套模块不足以增强特征对解码器的响应,编码器的输出特征与解码器的输入特征之间存在语义差异,从而使红外图像到分隔空间的映射关系难以建立;最后,对深层目标和背景的远距离语境感知不准确。红外小目标可以与背景高度相似,一个强大的检测器不仅要感知目标的局部显著性,还要对背景的连续性进行建模。

技术实现思路

1、为解决上述问题,本发明公开了一种基于阶梯交互注意力和像素特征增强网络红外小目标检测方法,旨在预测更深层网络层中小目标和背景的上下文差异,具体包括以下步骤:

2、s1:将红外小目标的图像数据集划分为训练集和测试集。

3、s2:根据给定的训练集图像,将训练集图像输入至预先构建好的红外小目标检测网络模型的主干网络中提取层stage1、stage2、stage3、stage4、stage5来获取高级特征,;为通道维度,其中;所述的训练集图像是三通道图像,其中的h和w分别表示图像的高度和宽度;所述 s2主干网络中提取层是提取含有红外小目标图像的多尺度特征,其中stage1、stage2、stage3、stage4均使用的是resnet10,其中resnet后面的数字表示了表示了红外小目标检测网络模型中的卷积层数量,而stage5采用的是resnet-10c,c表示不改变通道数,只进行特征提取。

4、s3:将主干网络提取的高级特征,这些高级特征被分别输入到阶梯交互注意力模块中,得到输出特征,;阶梯交互注意力模块中共有六个非局部通道融合注意力模块,。

5、s3-1:在非局部通道融合注意力模块中,该模块旨在将物体大小和特征自适应融合,促进不同层级特征之间的语义交互,并学习图像长距离上下文的相关性;对于融合注意力模块分别接受特征(,),(,),(,)的信息,可以负责捕获特征之间的长距离依赖性,强化了模型对图像不同部分的关联性学习能力,输出特征,对于特征直接为该阶梯交互注意力模块的输出特征,对于其他的输出特征,,将进行输入到其余非局部通道融合注意力模块中,得到输出特征, ;这种融合策略使得能够逐渐聚合和细化特征,来增强特征的标识能力。这样不仅包含当前层的信息,还融合了较深层的下文信息;最终的输出特征具有与原始高级特征相同的空间维度,这样保持网络的整体特征对齐。

6、s4:将阶梯交互注意力模块的输出特征和主干网络提取的高级特征通过残差连接进行相加融合,然后分别输入到像素特征增强模块中获得增强特征,。

7、s4-1:通过残差连接进行相加融合,加强了网络对信息的保持能力,避免了在传递过程中信息的丢失;然后分别输入到像素特征增强模块中,该模块是为了通过逐像素的操作对特征进行细化,在多尺度环境下融合全局空间和局部通道信息,从而显著提升网络对图像特征的捕获和表达能力;即对于输入的特征,都将被单独地处理和优化,在素特征增强模块中,这些特征被处理以增强其表示能力,目的是利用空间和通道的信息已增加网络对图像的细节和结构的敏感性,获得增强特征,,显示了经过模块优化后的特征空间压缩和信息密度增加。

8、s5:将像素增强模块输出的增强特征和主干网络提取的高级特征和主干网络提取的高级特征,即;分别输入多维特征融合模块中融合来自网络不同层级的特征,采用了交叉注意力卷积(cac)和两个cbl(cnvolution +batchnorm+leakeyrelu)块,获得融合特征图,此时。

9、s5-1:交叉注意力卷积通过分析两个不同维度的特征图实现了深层特征和底层特征之间的有效融合,生成了包含两种特征信息的融合特征图;具体地,交叉注意力卷积接受来自前一层的高层特征和当前层的增强特征作为输入,例如:,,,;每一次cac操作后,输出的特征图会进一步通过两个连续的cbl块进行处理;每个cbl包括一次卷积操作、一个批量归一化(banchnorm)和一个leakeyrelu激活函数;这种组合不仅加强了模型的非线性处理能力,还提高了网络的训练稳定性和泛化能力。解码过程中每个cbl块的作用是进一步提炼和增强由cac生成的特征图,输出最终的融合特征图,;

10、即:。

11、s6:为了提高梯度传播效率和特征表示,采用了一种多尺度深度监督策略来优化深度学习网络,针对每个网络输出的融合特征图,此时,使用卷积和simgmoid函数,来获得显著性图,数学表达式为:。

12、s6-1:在生成的显著性图中,对于那些分辨率低的显著性图进行上采样处理,使其尺寸扩展至与原始图像相同的大小;此步骤是为了确保网络能够在多个尺度上进行有效学习,并通过精细的空间分辨率改善特征的标识;

13、接下来,通过计算所有显著图与真实值(y)之间的二值交叉熵(binary cross-entropy,bce)损失来优化网络的性能;具体地,对于第一个显著性图直接计算损失:;对于后续的显著图;

14、首先进行上采样进行上采样处理,再计算损失;最终整体损失函数由各个单独损失的加权和构成,每个损失项的权重;在此处均设为1,表达式为:e;其中,表示每个显著性图与真实标记之间的损失;表示对i从1到5中的所有项进行累加。通过这种深度监督方式可以显著提升网络对图像特征的学习效率和精度,从而在各种图像处理任务中实现更优的性能。

15、s7、以测试集图像作为训练完成的红外小目标检测网络模型的输入,获取最终的红外小目标检测结果。

16、与现有技术相比,本发明的技术方案具有以下的技术效果:

17、1、本发明可以有效提高预测的准确性,具有较好的可靠性和鲁棒性;本发明中通过阶梯交互注意力模块中,嵌入六个非局部通道融合注意力模块,不仅促进了不同层级特征之间的语义交互,而且还学习了图像长距离上下文的相关性;非局部通道融合模块能够强化模型对图像不同部分的关联性学习,减少由于目标与背景间对比度低而产生的错误。

18、2、通过残差连接将阶梯交互注意力模块的输出特征与主干网络的高级特征相加融合,加强了网络在特征传递过程中的信息保持能力,避免了在深层网络中的信息丢失问题;像素特征增强模块为每个输入特征+提供了单独的处理和优化,增强了网络对图像细节和结构的敏感性。

19、3、本发明通过逐步细化的特征处理和增强策略,最终输出具有较高信息密度的增强特征,有助于生成更为准确的目标检测结果。

本文地址:https://www.jishuxx.com/zhuanli/20240730/193984.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。