一种用于高分辨率图像的小目标检测方法及相关装置与流程
- 国知局
- 2024-12-06 12:27:42
本发明涉及目标检测,尤其涉及一种用于高分辨率图像的小目标检测方法及相关装置。
背景技术:
1、目标检测是一种用于识别图像或者视频中的目标,并确定其在图像中的位置的计算机视觉技术。它不仅识别对象的类别,还需要返回对象的边界框。早期的目标检测方法主要依赖手工设计的特征和经典机器学习算法,目前主流的目标检测算法基于深度学习,主要包括单阶段检测和双阶段检测两大类。双阶段检测器如faster r-cnn首先生成候选区域,然后在这些候选区域内进行目标分类和边界框回归。单阶段检测则直接在图像上进行目标检测,这通常可以达到更快的速度,但是在准确率上相较于两阶段的检测往往较低。
2、具有代表性的单阶段检测算法主要有yolo和ssd。yolo将目标检测视为回归问题,通过神经网络直接预测类别和边界框,速度非常快。并且引入了自动锚点生成机制,可以根据训练数据自适应地生成锚点框,以提高检测精度。在训练策略方面,yolo使用了多种数据增强技术,提高模型对不同尺度目标的检测能力。并且集成了混合精度训练,自动调整学习率等深度学习优化技术以提升训练的效率和速度。
3、虽然yolo在coco数据集上无论时间和准确度都有优秀的表现,但是在对高分辨率图像进行目标检测时,yolo需要对更多的像素进行检测,这使得yolo的检测速度变得非常缓慢。此外,对于高分辨率上的小尺度缺陷,yolo在特征提取的过程中,可能会因为多次的下采样导致细节信息的丢失,从而忽略原始图像中的小尺度缺陷区域。并且yolo在高层特征上进行目标检测时,虽然能够很好地捕捉大目标的信息,但对小目标往往无法得到较好的效果,其细节信息在高层特征中经过下采样和卷积操作被模糊化。基于以上几点原因,yolo在高分辨率图像上无法达到理想的效果,并且对于小目标的检测准确度会变得非常低。
4、针对工业视觉的目标检测领域,存在缺陷区域小,人力标注成本高,图像分辨率高的场景,任务可能涉及对实时性,准确率要求高的特点。目前主流的目标检测网络结构无法有效提取小目标的特征,对特征检测效果差,对高分辨率图像检测时间长。
技术实现思路
1、本发明的目的在于克服现有技术的不足,本发明提供了一种用于高分辨率图像的小目标检测方法及相关装置,能够展现出更好的泛化性能,提高了yolov5模型对小目标的检测效果,也增强了yolov5模型的稳定性和实用性。
2、为了解决上述技术问题,本发明实施例提供了一种用于高分辨率图像的小目标检测方法,所述方法包括:
3、获得高分辨率图像,并对所述高分辨率图像进行标注处理,生成标注高分辨率图像;
4、对所述标注高分辨率图像进行预处理,生成训练图像数据集;
5、将所述训练图像数据集中的训练图像数据输入改进yolov5模型中进行训练处理,获得收敛的yolov5模型;
6、获得待检测高分辨率图像,将所述待检测高分辨率图像输入收敛的yolov5模型进行小目标检测处理,获得小目标检测结果。
7、可选的,所述对所述高分辨率图像进行标注处理,生成标注高分辨率图像,包括:
8、对所述高分辨率图像中的小目标进行专家标注处理,生成标注高分辨率图像。
9、可选的,所述对所述标注高分辨率图像进行预处理,生成训练图像数据集,包括:
10、对所述标注高分辨率图像进行切块处理,生成若干个图像块;
11、基于频域和空间域对所述若干个图像块进行图像增强处理,生成训练图像数据集。
12、可选的,所述改进yolov5模型的骨干网络为cspdarknet53网络,所述cspdarknet53网络基于darknet53,由53个卷积层组成;所述改进yolov5模型还集成了跨阶段局部网络,通过跨阶段局部网络对图像进行特征分割并夸阶段融合;同时在骨干网络的前部加入低级特征层,所述低级特征层用于对高分辨率图像中的小目标进行定位处理。
13、可选的,所述改进yolov5模型的损失函数采用复合损失函数,所述复合损失函数包括边界框回归损失函数、目标置信度损失函数和分类损失函数,如下:
14、l=λcioulciou+λconflconf+λclslcls;
15、其中,l表示复合损失函数;lciou、lconf、lcls分别表示边界框回归损失函数、目标置信度损失函数和分类损失函数;λciou、λconf、λcls分别表示边界框回归损失函数、目标置信度损失函数和分类损失函数在复合损失函数中所占的权重。
16、可选的,所述将所述训练图像数据集中的训练图像数据输入改进yolov5模型中进行训练处理,获得收敛的yolov5模型,包括:
17、将所述训练图像数据集中的训练图像数据输入改进yolov5模型中,通过yolov5模型中的骨干网络提取所述训练图像数据中的多尺度图像特征;
18、基于所述多尺度图像特征利用复合损失函数进行训练图像数据中的小目标的混合损失计算处理,获得混合损失计算结果;
19、基于所述混合损失计算结果对所述改进yolov5模型的节点参数进行更新处理,获得收敛的yolov5模型。
20、可选的,所述基于所述多尺度图像特征利用复合损失函数进行训练图像数据中的小目标的混合损失计算处理,获得混合损失计算结果,包括:
21、对所述多尺度图像特征分别进行目标边界框、目标置信度和目标分类预测处理,获得目标预测边界框、目标预测置信度和目标预测分类;
22、基于复合损失函数利用目标预测边界框、目标预测置信度和目标预测分类加权计算目标边界框、目标置信度和目标分类对应的综合损失数据,获得综合损失数据;
23、基于所述综合损失数据对所述改进yolov5模型的节点参数进行更新处理,获得收敛的yolov5模型。
24、另外,本发明实施例还提供了一种用于高分辨率图像的小目标检测装置,所述装置包括:
25、标注模块:用于获得高分辨率图像,并对所述高分辨率图像进行标注处理,生成标注高分辨率图像;
26、图像预处理模块:用于对所述标注高分辨率图像进行预处理,生成训练图像数据集;
27、训练模块:用于将所述训练图像数据集中的训练图像数据输入改进yolov5模型中进行训练处理,获得收敛的yolov5模型;
28、目标检测模块:用于获得待检测高分辨率图像,将所述待检测高分辨率图像输入收敛的yolov5模型进行小目标检测处理,获得小目标检测结果。
29、另外,本发明实施例还提供了一种电子设备,包括处理器和存储器,所述处理器运行存储于所述存储器中的计算机程序或代码,实现如上述中任一项所述的小目标检测方法。
30、另外,本发明实施例还提供了一种计算机可读存储介质,用于存储计算机程序或代码,当所述计算机程序或代码被处理器执行时,实现如上述中任一项所述的小目标检测方法。
31、在本发明实施例中,通过改进yolov5模型,并在处理高分辨率图像时,通过对更多高分辨率的特征进行训练,增强对小目标的检测能力;训练策略方面,将高分辨率的图像缩放到不同尺度进行训练,并采用了多种数据增强技术以增强模型的鲁棒性;通过改进损失函数,使训练过程中模型更关注小目标的检测;从而能够有效地处理高分辨率图像带来的内存和计算压力;能够展现出更好的泛化性能,提高了yolov5模型对小目标的检测效果,也增强了yolov5模型的稳定性和实用性。
本文地址:https://www.jishuxx.com/zhuanli/20241204/341504.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表