技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于自适应选择卷积核大小的视觉检测、识别方法与装置与流程 > 正文

基于自适应选择卷积核大小的视觉检测、识别方法与装置与流程

国知局
2024-09-05 14:30:12

本发明涉及深度学习的模型训练相关领域，主要涉及到基于自适应选择卷积核大小的视觉检测、识别方法与装置，该方案有效提升了视觉检测、识别的准确性，降低了误检和漏检率。

背景技术：

1、随着工业自动化和智能制造的快速发展，产品质量检测成为关键环节。深度学习技术的普及，逐渐代替了传统人为手工或传统技术提取特征的方式。

2、然而，深度学习中传统的卷积网络模型通常采用固定大小的卷积核进行特征提取，其固定的卷积核大小为经验启发式以及从常规数据集中总结得到，这在多变的工业场景实际应用下可能存在影响，例如无法适应不同的缺陷尺寸或形态，导致检测精度有所下降。

3、现有方案采用多尺度卷积核的形式以及进行不同维度的特征融合来改善该问题，该方式对于模型的提升程度依赖与技术人员的专业基础知识。

技术实现思路

1、针对现有技术存在的不足，本发明提供了基于自适应选择卷积核大小的视觉检测、识别方法，本发明的方法由模型自主选择卷积核来提取更为合适的特征。

2、为实现上述目的，本发明提供如下技术方案:

3、基于自适应选择卷积核大小的视觉检测、识别方法，包括以下步骤：

4、步骤s1：图像数据获取阶段，通过图像收集模块进行目标图像的获取；

5、步骤s2：将获取的图像通过数据前处理模块进行训练前的数据预处理；

6、步骤s3：将处理后的数据传递至视觉检测识别模块进行检测；

7、步骤s4：将视觉检测识别模块检测到的结果根据需求选择数据后处理模块针对结果进行过滤或筛选，若不需要经过数据后处理模块则直接通过结果输出模块将结果进行返回。

8、作为本发明进一步的方案，所述步骤s2中，数据预处理的方式根据项目实际情况而定，包含大图裁切小图、大图缩放、图像去噪、图像直方图分析。

9、作为本发明进一步的方案，步骤s4中，过滤或筛选的方式根据项目实际情况而定，包含面积过滤，像素值过滤、位置过滤。

10、作为本发明进一步的方案，所述步骤s3中，视觉检测识别模块基于自适应选择卷积核大小的方法进行检测，其中具体包括：获取模型初始特征图，该特征图为前置神经网络卷积层计算得到的特征层图，获取该特征图后将该特征图经过三种大小的卷积核进行特征的深层次提取得到三种类型的特征图，并各自复制一份存至特征列表；然后将这三种特征图进行相加融合，得到融合后的特征；将该融合特征进行全局平均池化，提取其全局特征，然后为该全局特征添加注意力机制，使其特征带有不同值的权重，将带有权重的特征进行拆分；将注意力机制得到的特征与特征列表中的卷积特征进行加权相乘，并进行特征融合，最后得到融合后的特征。视觉检测识别模块包括不限于视觉检测、视觉识别以及缺陷检测等功能。在本发明中优选采用缺陷检测模块来实现基于自适应选择卷积核大小的方法进行检测。

11、作为本发明进一步的方案，获取该特征图后将该特征图经过三种大小的卷积核，分别为3*3、5*5、7*7进行特征的深层次提取得到三种类型的特征图。

12、作为本发明进一步的方案，将带有权重的特征进行拆分，分别为注意力机制a、注意力机制b、注意力机制c，然后将上述三种注意力机制得到的特征与特征列表中的三种卷积特征进行加权相乘，并进行特征融合，最后得到融合后的特征。

13、本发明还提供了基于自适应选择卷积核大小的视觉检测、识别装置，包括图像收集模块、数据前处理模块、视觉检测识别模块；在图像数据获取阶段通过图像收集模块进行目标图像的获取，将获取的图像通过数据前处理模块进行训练前的数据预处理，将处理后的数据传递至视觉检测识别模块进行检测，将视觉检测识别模块检测到的结果根据需求选择数据后处理模块针对结果进行过滤或筛选，若不需要经过数据后处理模块则直接通过结果输出模块将结果进行返回。

14、本发明具有以下有益效果：

15、本发明的基于自适应选择卷积核大小的视觉检测、识别方法，具有自适应性，模型可以根据数据的变换自主选择合适的卷积核进行迭代学习；具有普适性，自适应选择卷积核方法适用于目前常见的多类型模型，包括分类、检测以及分割等模型；具有良好的扩展性，基于卷积神经网络的自适应选择卷积核的方式，可以轻易扩展至其他例如人脸识别、文字识别等基于卷积网络的领域；具有多样性，该方式使得模型具备处理多特征样本的能。

16、本发明的核心在于基于自适应卷积核的视觉检测识别模块，该模块通过让模型在迭代过程中自主学习选择适合当前数据的卷积核大小。该方式可以提高模型对于多样数据的实用性，同时一定程度上避免了技术人员造成的人为失误导致的模型效果不佳的问题，与现有方案相比，本发明具有更高的实用性和广泛的应用前景；本发明方案包括五个模块分别为图像收集模块、数据前处理模块、视觉检测识别模块(基于自适应卷积核形式)、数据后处理模块以及结果输出模块。通过将这五个模块构成完整流程的形式，可以完成对于缺陷的端到端检测任务，解决了现有方案严重依赖技术人员以及不同数据的多样性导致影响模型的效果等问题。

17、为更清楚地阐述本发明的结构特征和功效，下面结合附图与具体实施例来对本发明进行详细说明。

技术特征：

1.基于自适应选择卷积核大小的视觉检测、识别方法，其特征在于，包括以下步骤：

2.如权利要求1所述的基于自适应选择卷积核大小的视觉检测、识别方法，其特征在于，所述步骤s2中，数据预处理的方式根据项目实际情况而定，包含大图裁切小图、大图缩放、图像去噪、图像直方图分析。

3.如权利要求2所述的基于自适应选择卷积核大小的视觉检测、识别方法，其特征在于，步骤s4中，过滤或筛选的方式根据项目实际情况而定，包含面积过滤，像素值过滤、位置过滤。

4.如权利要求3所述的基于自适应选择卷积核大小的视觉检测、识别方法，其特征在于，所述步骤s3中，视觉检测识别模块基于自适应选择卷积核大小的方法进行检测，其中具体包括：获取模型初始特征图，该特征图为前置神经网络卷积层计算得到的特征层图，获取该特征图后将该特征图经过三种大小的卷积核进行特征的深层次提取得到三种类型的特征图，并各自复制一份存至特征列表；然后将这三种特征图进行相加融合，得到融合后的特征；将该融合特征进行全局平均池化，提取其全局特征，然后为该全局特征添加注意力机制，使其特征带有不同值的权重，将带有权重的特征进行拆分；将注意力机制得到的特征与特征列表中的卷积特征进行加权相乘，并进行特征融合，最后得到融合后的特征。

5.如权利要求4所述的基于自适应选择卷积核大小的视觉检测、识别方法，其特征在于，获取该特征图后将该特征图经过三种大小的卷积核，分别为3*3、5*5、7*7进行特征的深层次提取得到三种类型的特征图。

6.如权利要求5所述的基于自适应选择卷积核大小的视觉检测、识别方法，其特征在于，将带有权重的特征进行拆分，分别为注意力机制a、注意力机制b、注意力机制c，然后将上述三种注意力机制得到的特征与特征列表中的三种卷积特征进行加权相乘，并进行特征融合，最后得到融合后的特征。

7.基于自适应选择卷积核大小的视觉检测、识别装置，其特征在于，包括图像收集模块、数据前处理模块、视觉检测识别模块；在图像数据获取阶段通过图像收集模块进行目标图像的获取，将获取的图像通过数据前处理模块进行训练前的数据预处理，将处理后的数据传递至视觉检测识别模块进行检测，将视觉检测识别模块检测到的结果根据需求选择数据后处理模块针对结果进行过滤或筛选，若不需要经过数据后处理模块则直接通过结果输出模块将结果进行返回。

技术总结本发明公开了基于自适应选择卷积核大小的视觉检测、识别方法，包括以下步骤：步骤S1：图像数据获取阶段，通过图像收集模块进行目标图像的获取；步骤S2：将获取的图像通过数据前处理模块进行训练前的数据预处理；步骤S3：将处理后的数据传递至视觉检测识别模块进行检测；步骤S4：将视觉检测识别模块检测到的结果根据需求选择数据后处理模块针对结果进行过滤或筛选，若不需要经过数据后处理模块则直接通过结果输出模块将结果进行返回，本发明的方法由模型自主选择卷积核来提取更为合适的特征。技术研发人员：黄冠杰,陈红星受保护的技术使用者：上海帆声图像科技有限公司技术研发日：技术公布日：2024/9/2