技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于ViT图像分割技术的序列号识别方法和装置与流程 > 正文

一种基于ViT图像分割技术的序列号识别方法和装置与流程

国知局
2024-07-31 23:01:39

本发明公开一种方法和装置，涉及人工智能分析，具体地说是一种基于vit图像分割技术的序列号识别方法和装置。

背景技术：

1、现代机房面临着日益庞大的设备数量和复杂的管理需求，现有的人工管理已经无法满足需求。目前目标检测技术可以帮助识别机房设备上的标签位置，并定位序列号所在区域。然而，目标检测技术可能会受到光线条件、标签遮挡等因素的影响，导致定位不准确或错过部分序列号。由于字符外观的变化、文字模糊或遮挡、光线不足等因素，ocr技术可能会面临识别准确度不高的问题，特别是在复杂的环境下。

技术实现思路

1、本发明针对现有技术的问题，提供一种基于vit图像分割技术的序列号识别方法和装置，基于vit分割大模型联合ocr技术，提升了序列号识别准确率。

2、本发明提出的具体方案是：

3、本发明提供一种基于vit图像分割技术的序列号识别方法，包括：

4、步骤1：建立序列号识别模型：

5、步骤11：建立图像数据集，图像数据集包含条形码/二维码与sn码信息的图像，

6、步骤12：对于数据集中的图像，进行数据增强操作，

7、步骤13：将数据增强操作后的数据集划分为训练集、验证集和测试集，并利用训练集进行序列号识别模型训练，

8、步骤14：根据测试集利用vit图像分割方法得到分割后结果，利用序列号识别模型进行条形码/二维码与sn码信息的识别，与vit获取的分割结果进行比较，优化序列号识别模型；

9、步骤2：建立序列号预测模型：

10、步骤21：收集包含二维码或条形码提取的序列号和ocr提取的序列号的图像数据，建立样本数据库，并为每个样本标注权重，形成样本的数据集，

11、步骤22：将数据集划分为训练集、验证集和测试集，

12、步骤23：使用机器学习方法利用训练集训练序列号预测模型，通过序列号预测模型根据序列号和相关特征到权重之间的映射关系，推测不全的序列号；

13、步骤3：根据待识别的图像情况，利用序列号识别模型和/或序列号预测模型进行序列号识别。

14、进一步，所述的一种基于vit图像分割技术的序列号识别方法中步骤11中建立图像数据集，包括：使用jpg、png、bmp格式图像数据，使用语义分割标注工具对图像进行标注，将图像和标注数据作为模型的图像数据集。

15、进一步，所述的一种基于vit图像分割技术的序列号识别方法中步骤12中进行数据增强操作，包括：翻转变换、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动、旋转变换和反射变换。

16、进一步，所述的一种基于vit图像分割技术的序列号识别方法中步骤21中提取每个样本的特征，特征包括二维码/条形码提取的序列号、ocr提取的序列号以及相关特征，相关特征包括序列号的长度、字符组成和字符出现频率。

17、本发明还提供一种基于vit图像分割技术的序列号识别装置，包括模型管理模块和识别模块，

18、模型管理模块建立序列号识别模型：

19、步骤11：建立图像数据集，图像数据集包含条形码/二维码与sn码信息的图像，

20、步骤12：对于数据集中的图像，进行数据增强操作，

21、步骤13：将数据增强操作后的数据集划分为训练集、验证集和测试集，并利用训练集进行序列号识别模型训练，

22、步骤14：根据测试集利用vit图像分割方法得到分割后结果，利用序列号识别模型进行条形码/二维码与sn码信息的识别，与vit获取的分割结果进行比较，优化序列号识别模型；

23、模型管理模块建立序列号预测模型：

24、步骤21：收集包含二维码或条形码提取的序列号和ocr提取的序列号的图像数据，建立样本数据库，并为每个样本标注权重，形成样本的数据集，

25、步骤22：将数据集划分为训练集、验证集和测试集，

26、步骤23：使用机器学习方法利用训练集训练序列号预测模型，通过序列号预测模型根据序列号和相关特征到权重之间的映射关系，推测不全的序列号；

27、识别模块根据待识别的图像情况，利用序列号识别模型和/或序列号预测模型进行序列号识别。

28、进一步，所述的一种基于vit图像分割技术的序列号识别装置中模型管理模块在步骤11中建立图像数据集，包括：使用jpg、png、bmp格式图像数据，使用语义分割标注工具对图像进行标注，将图像和标注数据作为模型的图像数据集。

29、进一步，所述的一种基于vit图像分割技术的序列号识别装置中模型管理模块在步骤12中进行数据增强操作，包括：翻转变换、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动、旋转变换和反射变换。

30、进一步，所述的一种基于vit图像分割技术的序列号识别装置中模型管理模块在步骤21中提取每个样本的特征，特征包括二维码/条形码提取的序列号、ocr提取的序列号以及相关特征，相关特征包括序列号的长度、字符组成和字符出现频率。

31、本发明的有益之处是：

32、本发明通过序列号识别模型和序列号预测模型能够处理相似字符，从而有效解决了相似字符的识别问题，从而提高了对相似字符的区分能力，并且抗干扰能力强，使其能够在光线不足、图像模糊等外界干扰因素下仍然保持较高的识别准确度。

技术特征：

1.一种基于vit图像分割技术的序列号识别方法，其特征是包括：

2.根据权利要求1所述的一种基于vit图像分割技术的序列号识别方法，其特征是步骤11中建立图像数据集，包括：使用jpg、png、bmp格式图像数据，使用语义分割标注工具对图像进行标注，将图像和标注数据作为模型的图像数据集。

3.根据权利要求1所述的一种基于vit图像分割技术的序列号识别方法，其特征是步骤12中进行数据增强操作，包括：翻转变换、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动、旋转变换和反射变换。

4.根据权利要求1所述的一种基于vit图像分割技术的序列号识别方法，其特征是步骤21中提取每个样本的特征，特征包括二维码/条形码提取的序列号、ocr提取的序列号以及相关特征，相关特征包括序列号的长度、字符组成和字符出现频率。

5.一种基于vit图像分割技术的序列号识别装置，其特征是包括模型管理模块和识别模块，

6.根据权利要求5所述的一种基于vit图像分割技术的序列号识别装置，其特征是模型管理模块在步骤11中建立图像数据集，包括：使用jpg、png、bmp格式图像数据，使用语义分割标注工具对图像进行标注，将图像和标注数据作为模型的图像数据集。

7.根据权利要求5所述的一种基于vit图像分割技术的序列号识别装置，其特征是模型管理模块在步骤12中进行数据增强操作，包括：翻转变换、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动、旋转变换和反射变换。

8.根据权利要求5所述的一种基于vit图像分割技术的序列号识别装置，其特征是模型管理模块在步骤21中提取每个样本的特征，特征包括二维码/条形码提取的序列号、ocr提取的序列号以及相关特征，相关特征包括序列号的长度、字符组成和字符出现频率。

技术总结本发明公开一种基于ViT图像分割技术的序列号识别方法和装置，涉及人工智能分析技术领域；包括：步骤1：建立序列号识别模型；步骤2：建立序列号预测模型；步骤3：根据待识别的图像情况，利用序列号识别模型和/或序列号预测模型进行序列号识别。技术研发人员：刘鑫雨,倪健,王晓晗,刘涵予,王鑫受保护的技术使用者：浪潮通信信息系统有限公司技术研发日：技术公布日：2024/7/29