一种基于深度可分离卷积自注意力编码的红外弱小目标检测方法与流程
- 国知局
- 2024-07-31 22:57:08
本发明属于红外弱小目标检,具体涉及一种基于深度可分离卷积自注意力编码的红外弱小目标检测方法。
背景技术:
1、红外弱小目标检测的目的是在红外图像中准确地检测和识别具有较低热信号或较小尺寸的目标物体。通过这种技术,可以有效地发现潜在的目标,如人体、车辆、无人机等,即使它们在红外图像中不太显眼或相对微小。这种技术的应用领域包括军事侦察、安防监控、无人驾驶、边境巡逻等,为提高安全性和实时响应能力提供了重要支持。准确的红外弱小目标检测有助于增强对特定目标的识别能力,并帮助人们更好地理解和应对复杂环境下的潜在风险或威胁。
2、基于数据驱动的算法这类算法通常采用卷积神经网络(cnn)或其他深度学习架构,通过多层次的卷积、池化和全连接等操作,从输入的红外图像中提取高级特征。然后,这些特征会被送入分类器,如支持向量机(svm)或逻辑回归(logistic regression),从而判断目标是否存在以及目标的位置。这类算法具有较好的鲁棒性和准确性,能够有效地处理目标尺寸、形态的变化,并且能够同时处理多个目标。在实际应用中,cnn可以采用一些先进的模型,如faster r-cnn、ssd、yolo等,这些模型已经被证明在目标检测中具有较好的效果。尽管最近网络的性能不断提高,但小目标的通道空间联系仍未被深入挖掘,导致模型提取上下文的能力不佳,从而造成模型的将目标从背景分离出来的能力有所下降。
技术实现思路
1、针对现有目标检测算法存在的不足,将卷积神经网络引入到红外弱小目标检测领域以提高检测算法对红外弱小目标的检测性能并作进一步改进,本发明提供一种基于深度可分离卷积自注意力编码的的红外弱小目标检测方法。
2、为此,本发明提供了一种基于深度可分离卷积自注意力编码的红外弱小目标检测方法,包括如下步骤:
3、步骤1:将红外小目标图像输入卷积模块得到特征图
4、f0=doubleconv3(i) (1)
5、其中,doubleconv3表示卷积核大小为3的双层卷积,c表示输入图像的通道数、h表示高度、w表示宽度,r表示实数域,c0表示特征图的通道数;
6、步骤2:将特征图输入深度可分离卷积的自注意力模块(dcnn-sa)进行水平编码,得到注意力特征图fattn;
7、步骤3:使用最大池化模块对得到注意力特征图fattn进行下采样操作,并使用1×1的卷积进一步扩充通道信息,得到特征图fc:
8、fc=f1×1(maxpool(fout)) (11);
9、步骤4:重复步骤2和步骤3,对输入特征进行连续四次的下采样和水平编码,得到不同尺寸的特征图;
10、步骤5:使用分组扩张卷积多尺度特征融合模块对步骤4得到的不同尺寸的特征图进行多尺度信息的提取和融合,得到融合特征图ff;
11、步骤6:使用双线性插值对提取到的特征进行上采样,然后通过卷积核大小为1×1的卷积层对特征进行压缩,得到第i层的输出特征i的取值范围是:0,1,2,3;
12、
13、步骤7:使用sigmoid函数来对输出特征图做处理从而得到目标检测结果:
14、
15、进一步的,所述步骤2:将特征图输入深度可分离卷积的自注意力模块(dcnn-sa)进行水平编码,得到注意力特征图fattn的具体过程是:
16、步骤201:对输入的特征通过线性映射分为query、key和value三个变量
17、
18、q=wq·fbn(fi) (2)
19、k=wk·fbn(fi) (3)
20、v=wv·fbn(fi) (4)
21、其中,fi表示第i层的输入的特征图,i的取值范围是:0,1,2,3;fbd表示批归一化(batch norm),q是队列变量,k是键变量,v是值变量;
22、步骤202:使用普通的卷积层对q,k,v进行通道压缩,再使用深度可分离卷积(dconv)来对提取的q,k,v进行进一步的通道聚合,最后使用矩阵变换得到
23、
24、
25、
26、
27、其中,f1×1卷积核大小为1×1的卷积层,fdconv代表卷积核大小为3×3的深度可分离卷积,表示rerange算子,用于改变矩阵维度,qr是维度变换后的队列变量,kr是维度变换后键变量,vr是维度变换后值变量;
28、步骤203:计算跨通道的交叉协方差,以生成隐式编码全局上下文的注意图
29、a=(kr)t·qr (8);
30、步骤204:对注意力图a进行使用softmax进行归一化计算,然后与矩阵v相乘得到自注意力加强后的特征矩阵
31、asf=v·softmax(a) (9);
32、步骤205:使用1×1的卷积将注意力特征矩阵asf的通管道进行恢复,并作为残差与输入特征进行相加:
33、fattn=f1×1(asf)+f0 (10)。
34、进一步的,所述步骤5:使用分组扩张卷积多尺度特征融合模块对步骤4得到的不同尺寸的特征图进行多尺度信息的提取和融合,得到融合特征图的具体过程是:
35、步骤501:通过卷积核为3的卷积层和一个双线性插值层来调整通道数和高级特征的大小,得到与低级特征尺度相同的压缩高级特征
36、f′h=fbilinear(f3×3(fh)) (13);
37、其中,
38、fbilinear(p)=f(q11)w11+f(q21)w21+f(q12)w12+f(q22)w22 (12)
39、其中,p表示带插值点,q表示四个定位点,w表示带插值点与四个定位点的线性插值权重fbilinear;
40、步骤502:将高级特征图fh与低级特征图fl沿通道维度分成四组,并将低级特征中的一个组与高级特征中的一个连接起来,得到四组融合特征
41、步骤503:对于每组融合特征使用卷积核大小为3的扩张卷积并将{1,3,5,7}的不同扩张率应用于不同的组,以提取和融合不同尺度的信息,得到增强的特征
42、步骤504:将四组增强的特征通道维度连接,然后应用卷积核大小为1的卷积层来实现不同尺度的特征之间的交互,得到融合特征图ff。
43、本发明的优点是:本发明提供这种基于深度可分离卷积自注意力编码的红外弱小目标检测方法具有如下优点:
44、(1)与传统的红外弱小目标检测算法相比,本方法可以通过多层神经网络实现对数据的非线性建模。在红外弱小目标检测中,目标通常具有复杂的纹理和形状特征,传统方法往往无法有效地捕捉这些非线性关系。本方法可以通过大规模数据的训练来自动学习特征表示,提供更好的非线性建模能力。
45、(2)与通用弱小目标检测方法相比,本方法使用基于自注意力的水平编码能够有效的丰富小目标的特征表示,扩充目标在通道上的隐式上下文特征,有助于目标的聚类和识别。
46、(3)与特定的红外弱小目标检测方法相比,使用基于分组扩张卷积的跳跃连接来对高级和低级特征进行融合,且不同的膨胀率能够有效的在每组特征卷积的过程中提取多尺度的信息,从而建立起输入特征和输出特征的长期依赖关系。
47、下面结合附图和实施例对本发明做详细说明。
本文地址:https://www.jishuxx.com/zhuanli/20240730/195461.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表