技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于多尺度特征融合的海上目标检测方法 > 正文

一种基于多尺度特征融合的海上目标检测方法

国知局
2024-11-18 18:14:11

本发明涉及海上目标检测，尤其是涉及一种基于多尺度特征融合的海上目标检测方法。

背景技术：

1、目前海上目标检测技术的应用场景越来越广泛，例如，在海洋渔业管理中，需要对渔船进行实时监控和调度；在海上交通监管中，需要对船舶的航行轨迹进行实时追踪和预警；在海洋环境监测中，需要对海洋污染、海洋生态等进行持续观测和分析。这些应用场景都对海上目标检测技术提出了更高的需求。

2、虽然基于深度学习技术的海上目标检测方法能够通过学习和分析大量图像数据，实现对各类海上目标的识别与定位，但是海上目标尺度变化大，在远处，海上目标占图像像素较小，可用于辨别目标的特征较少；在近处，不同大小的目标存在相互遮挡的情况，丢失了部分特征信息；在特殊天气条件，如大雾场景下，海上目标变的模糊，难以识别。

3、基于此，现有技术提出的解决方式是采用或者利用多尺度融合网络对特征信息进行融合。但是有两方面的问题没有考虑到：

4、第一方面，强大的特征提取网络虽然能够丰富图像特征，但是也提取到了不必要的噪声，导致漏检或误检现象发生；

5、第二方面，针对海上目标尺度跨度大，多尺度融合网络不够深，特征融合的不够完全，丢失了海上非常小目标的特征信息。这些问题导致了现有技术针对海上目标检测精度不高。

技术实现思路

1、本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种基于多尺度特征融合的海上目标检测方法，提高海上目标的检测精度和鲁棒性。

2、本发明的目的可以通过以下技术方案来实现：

3、一种基于多尺度特征融合的海上目标检测方法，包括以下步骤：

4、获取海上目标图像，并进行图像预处理；

5、将预处理后的海上目标图像输入特征提取网络中，得到不同层次、不同尺度的图像特征；

6、通过多层高效重参数化泛化特征金字塔网络，对特征提取网络输出的各个图像特征进行第一次多尺度特征融合，得到多个金字塔网络融合特征；

7、通过多层自适应结构特征融合网络，对各个金字塔网络融合特征进行第二次多尺度特征融合，得到多个自适应网络融合特征；

8、将各个自适应网络融合特征输入到分类回归网络，得到海上目标的类别和位置信息。

9、进一步地，所述特征提取网络为改进的inceptionnext网络，包括依次连接的p1阶段、p2阶段、p3阶段、p4阶段和p5阶段，所述p2阶段、p3阶段、p4阶段和p5阶段的输出分别作为多层高效重参数化泛化特征金字塔网络的输入。

10、进一步地，所述p1阶段包括一个conv模块，所述p2阶段包括依次连接的三个inceptionnext block模块，所述p3阶段包括依次连接的一个conv模块和三个inceptionnext block模块，所述p4阶段包括依次连接的一个conv模块和九个inceptionnext block模块，所述p5阶段包括依次连接的一个conv模块，三个inceptionnext block模块和一个sppf模块。

11、进一步地，所述inceptionnext block模块包括依次连接的spilt操作、四个并行分支、concat操作、cbam注意力机制、批归一化层和mlp层，所述inceptionnext block模块的输入还连接所述mlp层，各个并行分支分别为三个不同尺寸卷积核的深度可分离卷积和一个恒等映射，所述cbam注意力机制用于实现对关键信息的关注和不必要信息的抑制。

12、进一步地，所述sppf模块包括依次连接的首端conv模块、concat操作和尾端conv模块，所述首端conv模块和concat操作之间设有三个并联支路，各并联支路分别设有不同尺寸的maxpool层。

13、进一步地，所述多层高效重参数化泛化特征金字塔网络为四层高效重参数化泛化特征金字塔网络，包括依次连接的第一阶段、第二阶段、第三阶段、第四阶段、第五阶段、第六阶段和第七阶段；

14、所述第一阶段、第二阶段和第三阶段均包括依次连接的concat层、cspstage模块和dysample s+模块，所述第一阶段的concat层分别连接p4阶段的输出经过一个conv模块的处理结果以及p5阶段的输出；所述第二阶段的concat层分别连接p3阶段的输出经过一个conv模块的处理结果、第一阶段的输出以及p4阶段的输出；所述第三阶段的concat层分别连接p2阶段的输出经过一个conv模块的处理结果、第二阶段的输出以及p3阶段的输出；

15、所述第四阶段、第五阶段和第六阶段均包括依次连接的concat层、cspstage模块和conv模块，所述第四阶段的concat层分别连接p2阶段的输出和第三阶段的输出；所述第五阶段的concat层分别连接第四阶段的输出和第三阶段中cspstage模块的输出；所述第六阶段的concat层分别连接第三阶段中cspstage模块的输出经过一个conv模块的处理结果、第五阶段的输出以及第二阶段中cspstage模块的输出，所述第六阶段的cspstage模块还连接第二阶段的concat层；所述第七阶段的concat层分别连接第二阶段concat层的输出经过一个conv模块的处理结果、第一阶段中cspstage模块的输出以及第六阶段的输出。

16、进一步地，所述多层自适应结构特征融合网络为四层自适应结构特征融合网络，包括asff-1分支、asff-2分支、asff-3分支和asff-4分支，所述asff-1分支、asff-2分支、asff-3分支和asff-4分支均分别连接第四阶段、第五阶段、第六阶段和第七阶段中cspstage模块的输出，并进行特征融合，分别得到对应的自适应网络融合特征。

17、进一步地，所述四层自适应结构特征融合网络的各个分支进行特征融合的过程中，为各个特征分配对应的权重，各个权重均通过自适应学习得到。

18、进一步地，所述分类回归网络包括多个检测头结构，各个检测头结构分别处理对应的自适应网络融合特征，各个检测头结构均包括回归分支和预测分支，所述回归分支包括依次连接的conv模块、卷积模块和ciou损失函数；所述预测分支包括依次连接的conv模块、卷积模块和bce损失函数。

19、进一步地，所述ciou损失函数的计算表达式为：

20、

21、

22、式中，ciou为ciou损失函数的计算结果，bgt为真实框的面积，bprd为预测框的面积，ρ2(bgt,bprd)为这真实框和预测框中心之间的距离，wc和hc是覆盖这两个框的最小封闭框的宽度和高度，iou、α和υ均为中间量，hprd、wprd分别为预测框的高度和宽度，hgt和wgt分别为真实框的高度和宽度；

23、所述bce损失函数的计算表达式为：

24、

25、式中，bce为bce损失函数的计算结果，yi是二元标签，值为0或者1，p(yi)表示样本i预测为正类的概率，n表示样本数。

26、与现有技术相比，本发明具有以下优点：

27、(1)本发明中的特征提取网络，即改进的inceptionnext，具有出色的性能。它能够有效地提取图像中不同层次的多尺度信息，丰富了图像的特征。在inceptionnext block模块中创新性地引入了cbam注意力机制，使网络能够更加聚焦于重要的信息，同时有效抑制不必要的信息，从而提高了特征提取的准确性和效率。

28、(2)本发明设计了四层高效重参数化泛化特征金字塔网络。相比efficient-repgfpn，该网络增加了深度，这使得网络能够更充分地交换高级语义信息和低级空间信息，加强了对多尺度目标的识别能力。在上采样阶段，利用dysample s+，不仅没有增加网络计算量，而且有效提升了图像的分辨率，实现了第一次多尺度特征信息的融合。

29、(3)为了进一步优化特征融合效果，本发明提出了四层自适应结构特征融合网络。与现有的自适应结构特征融合网络(adaptively spatial feature fusion,asff)相比，这一网络具有更强的多尺度融合能力。它能够对冲突信息进行空间过滤，有效抑制不一致的信息，并增强特征的尺度不变性。提高了在复杂背景下对多尺度目标的识别能力，实现了第二次多尺度特征信息的融合。

30、(4)本发明的特征提取网络不仅能够充分提取多尺度的特征信息，而且通过两次多尺度信息的融合，实现了对多尺度信息的充分利用。这一创新设计使得网络在复杂场景下对多尺度目标的识别能力得到了显著提升。