技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种半导体产品信息字符OCR识别系统的制作方法  >  正文

一种半导体产品信息字符OCR识别系统的制作方法

  • 国知局
  • 2024-10-21 14:22:00

本发明涉及光学字符识别领域,尤其是涉及半导体产品信息识别,具体为一种半导体产品信息字符ocr识别系统。

背景技术:

1、光学字符识别是指通过相机检查标签打印的字符,通过检测字符暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程,并通过识别软件将图像中的文字转换成文本格式供文字处理软件进一步编辑加工的技术。

2、现有适用于半导体产品信息的字符识别误识别率低,不同缺失样像的字符都存在着识别成其他字符的可能性,具体的,如附图中的“3”“0”“f”“i”字符缺失,需要根据缺失特征识别成原字符,算法根据缺失特征去补充转换成计算机文字,然后在字符库里匹配类似字符,文字识别库种类多,现有的字符识别是根据特征去翻译成完整的字符,这就导致了出现误翻译,并且要识别的字符数量较多,超过200个,并且字符数量及内容是变化的,导致字符无法准确的识别,不能满足实际生产把缺失字符检出的目的。

技术实现思路

1、鉴于以上所述现有技术的缺点,本发明的目的在于提供一种半导体产品信息字符ocr识别系统,用于解决现有技术的难点。

2、为实现上述目的及其他相关目的,本发明提供一种半导体产品信息字符ocr识别系统,包括:

3、步骤s1:输入图像,并将图像转换成灰度图像;

4、步骤s2:卷积层:

5、对图像进行cnn卷积神经网络操作,提取特征向量,获得特征向量的集合;

6、步骤s3:循环层:

7、对经过步骤s2获取的每个特征向量在lstm中按照一个时间步就传入一个特征向量进行分类;

8、步骤s4:在rnn中根据步骤s2输入的特征向量进行预测,对每个矩形区域进行预测对应的字符,获得所有字符的softmax概率分布;

9、步骤s5:根据步骤s3和步骤s4获得循环层的后验概率矩阵;

10、步骤s6:转录层:

11、使用ctc的损失函数来对cnn和rnn进行端到端的联合训练,将循环层对每个特征向量所做的预测转换成标签序列。

12、根据优选方案,步骤s2中,输入图像的高度为32,输出图像高度为1。

13、根据优选方案,步骤s2中,输入图像的宽度为160,宽度也可以为其他的值,但需要统一。

14、根据优选方案,经过所述步骤s4的后验概率矩阵内包括由输入特征向量x^t和输出所有字符的概率分布y^t组成的矩阵。

15、根据优选方案,在所述步骤s1之前,对采集得到的图像还需要进行图像预处理。

16、根据优选方案,图像预处理包括明亮度调整,整形和去噪。

17、根据优选方案,在所述循环层中去除不使用的字符类型,建立自适应字符库。

18、根据优选方案,对所述字符库进行分类,包括无缺失和缺失字符科。

19、根据优选方案,缺失字符库统一采用特定字符,如*。

20、根据优选方案,字符库中的无缺失还包括可接受的缺失,缺失则代表不能接受的缺失。

21、本发明利用卷积层对输入图像提特征,得到特征图;通过循环层对特征序列进行预测,对序列中的每个特征向量进行学习,并输出预测标签真实值的分布。

22、下文中将结合附图对实施本发明的最优实施例进行更详尽的描述,以便能容易地理解本发明的特征和优点。

技术特征:

1.一种半导体产品信息字符ocr识别系统,其特征在于,包括:

2.根据权利要求1所述的半导体产品信息字符ocr识别系统,其特征在于,所述步骤s2中,输入图像的高度为32,输出图像高度为1。

3.根据权利要求2所述的半导体产品信息字符ocr识别系统,其特征在于,经过所述步骤s4的后验概率矩阵内包括由输入特征向量x^t和输出所有字符的概率分布y^t组成的矩阵。

4.根据权利要求3所述的半导体产品信息字符ocr识别系统,其特征在于,在所述步骤s1之前,对采集得到的图像还需要进行图像预处理。

5.根据权利要求4所述的半导体产品信息字符ocr识别系统,其特征在于,在所述循环层中去除不使用的字符类型,建立自适应字符库。

6.根据权利要求5所述的半导体产品信息字符ocr识别系统,其特征在于,对所述字符库进行分类,包括无缺失和缺失字符科。

7.根据权利要求6所述的半导体产品信息字符ocr识别系统,其特征在于,所述字符库中的无缺失还包括可接受的缺失,缺失则代表不能接受的缺失。

技术总结本发明提供一种半导体产品信息字符OCR识别系统,包括卷积层、循环层和转录层,输入灰度图像;对图像进行CNN卷积神经网络操作,提取特征向量,获得特征向量的集合;每个特征向量在LSTM中按照一个时间步就传入一个特征向量进行分类;在RNN中对特征向量进行预测,对每个矩形区域进行预测对应的字符,获得所有字符的softmax概率分布;获得循环层的后验概率矩阵;使用CTC的损失函数来对CNN和RNN进行端到端的联合训练,将循环层对每个特征向量所做的预测转换成标签序列。本发明利用卷积层对输入图像提特征,得到特征图;通过循环层对特征序列进行预测,对序列中的每个特征向量进行学习,并输出预测标签真实值的分布。技术研发人员:包增利,曹源圆受保护的技术使用者:海太半导体(无锡)有限公司技术研发日:技术公布日:2024/10/17

本文地址:https://www.jishuxx.com/zhuanli/20241021/317883.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。