技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于卷积神经网络的小目标检测方法  >  正文

一种基于卷积神经网络的小目标检测方法

  • 国知局
  • 2024-08-08 16:54:35

本发明涉及图像信息处理,具体公开了一种基于卷积神经网络的小目标检测方法。

背景技术:

1、小目标检测在计算机视觉领域具有重要的应用价值,涉及安全监控、卫星图像解析、自动驾驶汽车等多个领域。小目标通常指在图像中占据像素较少的目标,这些目标的检测对提高整体监控系统的精确性和反应速度具有重大意义。目前常见的目标检测技术,如r-cnn、ssd和yolo等,主要针对中大尺寸目标进行优化,对小目标的检测效率和精度较低。这些算法在小目标特征提取和定位方面面临挑战,尤其是在复杂背景或低分辨率的情况下。

2、卷积神经网络(cnn)因其强大的特征提取能力已广泛应用于图像识别和目标检测。然而,传统的cnn模型在处理小目标时往往忽略了目标的细节信息,导致检测性能不佳。在传统卷积神经网络中,多次池化和卷积操作可能导致小目标的特征信息丢失,特别是在网络较深的情况下,小目标的有效信息难以保留。小目标检测常受到复杂背景的干扰,尤其是在目标与背景对比度不明显时,现有算法难以区分小目标和背景噪声。现有的目标检测算法在处理不同尺度的目标时效果差异大,特别是在小尺度目标检测上,效果通常不理想。现有的单一尺度或固定尺度的特征提取方式难以适应小目标的多样性和尺度变化。

技术实现思路

1、本发明的目的在于针对上述问题,提供了一种基于卷积神经网络的小目标检测方法。

2、为了达到上述发明目的,本发明采用的技术方案为:

3、一种基于卷积神经网络的小目标检测方法,所述方法包括以下步骤:

4、s1、数据集扩充:采用imagenet分类,通过对标注图像应用随机旋转、平移或颜色扰动来生成新的训练图像;采用合成雾算法对数据集进行增强,从而提高模型在雾场景下的鲁棒性;将数据集增强后,其样本按照voc2007数据集格式制作成新的数据集,按照8:2的比例分别划分为训练集和验证集;改进锚框机制,利用k-means++算法对数据集进行聚类,精确定位目标位置,提高检测算法的性能,样本中的目标大小各异,如果所选的先验框大小不符合数据集中样本大小,会导致训练结果拟合效果;

5、s2、构建卷积神经网络模型:所述卷积神经网络由特征提取模块、特征增强模块、识别和定位模块依次连接组成;所述特征提取模块用于从输入数据中提取有用的特征信息,其输出作为下一阶段特征增强模块的输入,特征增强模块用于对提取的目标特征进行增强,以提高检测和定位的精度,其特征增强模块的输出再作为识别和定位模块的输入,根据增强的目标特征进行目标的识别和定位;

6、具体如下:

7、(1)搭建一个10层的特征提取模块,包括一个focus层、四个卷积层、四个pc3层以及一个池化层;其结构依次为:focus层→第一卷积层→第一pc3层→第二卷积层→第二pc3层→第三卷积层→第三pc3层→第四卷积层→第四pc3层→池化层;

8、(2)搭建一个22层的特征增强模块,主要结构包括五个卷积层、五个pc3层、三个上采样层、五个拼接层以及四个cbam注意力机制;其结构依次为:第五卷积层→第一上采样层→第一拼接层→第五pc3层→第一cbam层→第六卷积层→第二上采样层→第二拼接层→第六pc3层→第二cbam层→第七卷积层→第三上采样层→第三通道拼接层→第七pc3层→第三cbam层→第八卷积层→第四通道拼接层→第八pc3层→第四cbam层→第九卷积层→第五通道拼接层→第九pc3层;

9、(3)搭建一个3层的识别和定位模块,,其结构依次为:第十卷积层→第十一卷积层→第十二卷积层;并将第十、十一、十二卷积层中卷积核的个数分别设置为128,256,512,卷积核的大小均设置为1×1,步长均设置为1;

10、s3、模型训练:将训练集样本送入到模型中进行训练学习,并在训练过程中优化模型参数、自动调整学习率;主要训练过程为:

11、(1)网络进行权值的初始化;

12、(2)输入数据经过卷积层、下采样层、全连接层的向前传播得到输出值;

13、求出网络的输出值与目标值之间的误差;

14、当误差大于期望值时,将误差传回网络中,依次求得全连接层,下采样层,卷积层的误差,当误差等于或小于期望值时,结束训练;

15、根据求得误差进行权值更新,然后再进入到第2步,直至focal loss值降至3.0以下为止,得到训练好的卷积神经网络;

16、s4、模型预测与评估:将验证集样本送入已经训练好的模型中验证,输出对图片中待检测小目标的类别和目标所在的每个外接矩形框位置。

17、进一步地,其中所述的合成雾算法如下:

18、

19、式中,为原始无雾图像,为大气光,为透射率。的范围为0~1,表示所添加的雾的灰度。当时加入纯白雾,当时加入纯黑雾。的范围为0~1,表示原始图像和雾化输出图像中的比例。当时,所有的场景都可以通过雾,即没有雾;当时,没有任何场景可以通过纯白雾,即输出为纯白雾。

20、进一步地,所述的特征提取模块共10层,设置每层的参数为:focus层卷积核的个数为64,卷积核的大小设置为6×6,将第一至第四卷积层中卷积核的个数分别设置为128,256,512,1024,卷积核的大小均设置为3×3,步长均设置为1,且每一个卷积层均进行卷积操作、批归一化处理和leaky relu激活处理;将第一至第四pc3层中卷积核的大小均设置为1×1,池化层采用3个最大池化和一个标准卷积进行拼接,池化层中池化核的大小均设置为5×5,步长设置为1;所述focus层进行一次下采样和卷积操作,下采样时宽和高都降为原来的一半,通道数增加到原来的四倍,卷积操作的卷积核大小为6×6,步长为1;每一个pc3层有两支操作,左支是通过一个部分卷积操作,右支是通过一个部分卷积操作再通过残差结构,将两条支路进行通道拼接后再进行一次卷积操作,pc3中的卷积核大小均设置为1×1,步长均设置为1。

21、进一步地,所述的特征增强模块共22层,设置每层的参数为:将第五至第九卷积层中卷积核的个数分别设置为512,256,128,128,256,第五至第七卷积层中卷积核的大小设置为1×1,步长均设置为1,第八至第九卷积层中卷积核的大小设置为3×3,步长均设置为2,将第五至第九pc3层中卷积核的大小均设置为1×1;第一拼接层的输入是第一上采样层和第三pc3层的输出,第二拼接层的输入是第二上采样层和第二pc3层的输出,第三拼接层的输入是第三上采样层和第一pc3层的输出,第四拼接层的输入是第七卷积层和第八卷积层的输出,第五拼接层的输入是第六卷积层和第九卷积层的输出。

22、进一步地,所述的识别和定位模块共3层,其结构为三个卷积层,分别是:第十卷积层、第十一卷积层、第十二卷积层;其中第十卷积层、第十一卷积层、第十二卷积层的输入分别接第七pc3层、第八pc3层和第九pc3层的输出,每一层的卷积核的个数分别设置为128,256,512,卷积核的大小均设置为1×1,步长均设置为1。

23、进一步地,所述的模型训练中,定义focal loss函数为:

24、

25、

26、式中:为一个常数,作用是保持函数连续;,和是超参数,作用是控制所抑制的程度,两个边界框的最小闭合区的宽度和高度在公式中用和表示;表示交并比,、、分别为预测框的中心点、宽度和高度;、、分别为实际框的中心点、宽度和高度;、、分别为预测框与真实框之间的中心点、宽度和高度之间的欧式距离。

27、有益效果:

28、与现有技术相比,本发明的基于卷积神经网络的小目标检测方法具有以下优势:通过优化卷积神经网络结构,能够自动地从训练数据中学习到有用的特征,无需人工设计或选择特征,这一点对于小目标检测尤其重要,因为小目标的特征可能不明显,难以用传统方法有效提取;cnn可以通过使用不同尺寸的卷积核网络结构来处理不同尺度的输入,从而更有效地检测不同大小的目标;优化后的网络架构规模小,可实现快速的处理速度,这使得它可以用于需要实时或接近实时反馈的小目标检测应用。

本文地址:https://www.jishuxx.com/zhuanli/20240808/271138.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。