一种基于ViT图像分割技术的序列号识别方法和装置与流程
- 国知局
- 2024-07-31 23:01:39
本发明公开一种方法和装置,涉及人工智能分析,具体地说是一种基于vit图像分割技术的序列号识别方法和装置。
背景技术:
1、现代机房面临着日益庞大的设备数量和复杂的管理需求,现有的人工管理已经无法满足需求。目前目标检测技术可以帮助识别机房设备上的标签位置,并定位序列号所在区域。然而,目标检测技术可能会受到光线条件、标签遮挡等因素的影响,导致定位不准确或错过部分序列号。由于字符外观的变化、文字模糊或遮挡、光线不足等因素,ocr技术可能会面临识别准确度不高的问题,特别是在复杂的环境下。
技术实现思路
1、本发明针对现有技术的问题,提供一种基于vit图像分割技术的序列号识别方法和装置,基于vit分割大模型联合ocr技术,提升了序列号识别准确率。
2、本发明提出的具体方案是:
3、本发明提供一种基于vit图像分割技术的序列号识别方法,包括:
4、步骤1:建立序列号识别模型:
5、步骤11:建立图像数据集,图像数据集包含条形码/二维码与sn码信息的图像,
6、步骤12:对于数据集中的图像,进行数据增强操作,
7、步骤13:将数据增强操作后的数据集划分为训练集、验证集和测试集,并利用训练集进行序列号识别模型训练,
8、步骤14:根据测试集利用vit图像分割方法得到分割后结果,利用序列号识别模型进行条形码/二维码与sn码信息的识别,与vit获取的分割结果进行比较,优化序列号识别模型;
9、步骤2:建立序列号预测模型:
10、步骤21:收集包含二维码或条形码提取的序列号和ocr提取的序列号的图像数据,建立样本数据库,并为每个样本标注权重,形成样本的数据集,
11、步骤22:将数据集划分为训练集、验证集和测试集,
12、步骤23:使用机器学习方法利用训练集训练序列号预测模型,通过序列号预测模型根据序列号和相关特征到权重之间的映射关系,推测不全的序列号;
13、步骤3:根据待识别的图像情况,利用序列号识别模型和/或序列号预测模型进行序列号识别。
14、进一步,所述的一种基于vit图像分割技术的序列号识别方法中步骤11中建立图像数据集,包括:使用jpg、png、bmp格式图像数据,使用语义分割标注工具对图像进行标注,将图像和标注数据作为模型的图像数据集。
15、进一步,所述的一种基于vit图像分割技术的序列号识别方法中步骤12中进行数据增强操作,包括:翻转变换、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动、旋转变换和反射变换。
16、进一步,所述的一种基于vit图像分割技术的序列号识别方法中步骤21中提取每个样本的特征,特征包括二维码/条形码提取的序列号、ocr提取的序列号以及相关特征,相关特征包括序列号的长度、字符组成和字符出现频率。
17、本发明还提供一种基于vit图像分割技术的序列号识别装置,包括模型管理模块和识别模块,
18、模型管理模块建立序列号识别模型:
19、步骤11:建立图像数据集,图像数据集包含条形码/二维码与sn码信息的图像,
20、步骤12:对于数据集中的图像,进行数据增强操作,
21、步骤13:将数据增强操作后的数据集划分为训练集、验证集和测试集,并利用训练集进行序列号识别模型训练,
22、步骤14:根据测试集利用vit图像分割方法得到分割后结果,利用序列号识别模型进行条形码/二维码与sn码信息的识别,与vit获取的分割结果进行比较,优化序列号识别模型;
23、模型管理模块建立序列号预测模型:
24、步骤21:收集包含二维码或条形码提取的序列号和ocr提取的序列号的图像数据,建立样本数据库,并为每个样本标注权重,形成样本的数据集,
25、步骤22:将数据集划分为训练集、验证集和测试集,
26、步骤23:使用机器学习方法利用训练集训练序列号预测模型,通过序列号预测模型根据序列号和相关特征到权重之间的映射关系,推测不全的序列号;
27、识别模块根据待识别的图像情况,利用序列号识别模型和/或序列号预测模型进行序列号识别。
28、进一步,所述的一种基于vit图像分割技术的序列号识别装置中模型管理模块在步骤11中建立图像数据集,包括:使用jpg、png、bmp格式图像数据,使用语义分割标注工具对图像进行标注,将图像和标注数据作为模型的图像数据集。
29、进一步,所述的一种基于vit图像分割技术的序列号识别装置中模型管理模块在步骤12中进行数据增强操作,包括:翻转变换、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动、旋转变换和反射变换。
30、进一步,所述的一种基于vit图像分割技术的序列号识别装置中模型管理模块在步骤21中提取每个样本的特征,特征包括二维码/条形码提取的序列号、ocr提取的序列号以及相关特征,相关特征包括序列号的长度、字符组成和字符出现频率。
31、本发明的有益之处是:
32、本发明通过序列号识别模型和序列号预测模型能够处理相似字符,从而有效解决了相似字符的识别问题,从而提高了对相似字符的区分能力,并且抗干扰能力强,使其能够在光线不足、图像模糊等外界干扰因素下仍然保持较高的识别准确度。
技术特征:1.一种基于vit图像分割技术的序列号识别方法,其特征是包括:
2.根据权利要求1所述的一种基于vit图像分割技术的序列号识别方法,其特征是步骤11中建立图像数据集,包括:使用jpg、png、bmp格式图像数据,使用语义分割标注工具对图像进行标注,将图像和标注数据作为模型的图像数据集。
3.根据权利要求1所述的一种基于vit图像分割技术的序列号识别方法,其特征是步骤12中进行数据增强操作,包括:翻转变换、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动、旋转变换和反射变换。
4.根据权利要求1所述的一种基于vit图像分割技术的序列号识别方法,其特征是步骤21中提取每个样本的特征,特征包括二维码/条形码提取的序列号、ocr提取的序列号以及相关特征,相关特征包括序列号的长度、字符组成和字符出现频率。
5.一种基于vit图像分割技术的序列号识别装置,其特征是包括模型管理模块和识别模块,
6.根据权利要求5所述的一种基于vit图像分割技术的序列号识别装置,其特征是模型管理模块在步骤11中建立图像数据集,包括:使用jpg、png、bmp格式图像数据,使用语义分割标注工具对图像进行标注,将图像和标注数据作为模型的图像数据集。
7.根据权利要求5所述的一种基于vit图像分割技术的序列号识别装置,其特征是模型管理模块在步骤12中进行数据增强操作,包括:翻转变换、随机修剪、色彩抖动、平移变换、尺度变换、对比度变换、噪声扰动、旋转变换和反射变换。
8.根据权利要求5所述的一种基于vit图像分割技术的序列号识别装置,其特征是模型管理模块在步骤21中提取每个样本的特征,特征包括二维码/条形码提取的序列号、ocr提取的序列号以及相关特征,相关特征包括序列号的长度、字符组成和字符出现频率。
技术总结本发明公开一种基于ViT图像分割技术的序列号识别方法和装置,涉及人工智能分析技术领域;包括:步骤1:建立序列号识别模型;步骤2:建立序列号预测模型;步骤3:根据待识别的图像情况,利用序列号识别模型和/或序列号预测模型进行序列号识别。技术研发人员:刘鑫雨,倪健,王晓晗,刘涵予,王鑫受保护的技术使用者:浪潮通信信息系统有限公司技术研发日:技术公布日:2024/7/29本文地址:https://www.jishuxx.com/zhuanli/20240730/195672.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表