技术新讯 > 计算推算,计数设备的制造及其应用技术 > 图像识别方法、装置、设备、介质和程序产品与流程  >  正文

图像识别方法、装置、设备、介质和程序产品与流程

  • 国知局
  • 2024-08-05 12:18:40

本公开涉及图像识别技术、人工智能技术和金融领域,更具体地,涉及一种图像识别方法、装置、设备、介质和程序产品。

背景技术:

1、随着人工智能技术的发展,可以通过对图像进行图像识别,以提取出图像中的字符信息,得到字符识别结果。例如,可以通过对卡片图像进行识别,确定字符区域图像,进而可以提取出字符区域图像中的字符信息,得到字符识别结果。

2、在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题:由于卡片图像中除字符信息之外通常还包含背景信息,并且卡片图像中的字符信息受字符内容的字体、颜色、印刷或刻印方式等的影响较大,使得在对卡片图像进行图像识别过程中不能准确检测出字符区域,造成卡片图像中字符的识别效率低。

技术实现思路

1、鉴于上述问题,本公开提供了图像识别方法、装置、设备、存储介质和程序产品。

2、根据本公开的一个方面,提供了一种图像识别方法,包括:对原始卡片图像进行特征提取,得到特征图像,特征图像包括至少一个特征图像点,特征图像点具有能够反映像素变化的特征值;从原始卡片图像中确定包含目标特征图像点的字符区域图像,目标特征图像点是将至少一个特征图像点对应的特征值进行比较得到的,字符区域图像包括至少一个字符;对字符区域图像进行分割处理,得到与字符对应的字符子图像;将字符子图像输入识别模型,输出原始卡片图像的字符识别结果。

3、根据本公开的实施例,上述的对字符区域图像进行分割处理,得到与字符对应的字符子图像包括:对字符区域图像进行像素转换,得到待分割图像;对待分割图像中每一行或列中至少一种的第一目标像素点进行统计,得到像素点统计结果;基于像素点统计结果对待分割图像进行字符分割,得到与字符对应的字符子图像。

4、根据本公开的实施例,上述的对字符区域图像进行像素转换,得到待分割图像包括:对字符区域图像进行颜色空间转换,得到第一颜色空间的待分类图像;根据待分类图像的第二目标像素点的占比率对待分类图像进行分类,得到分类结果;基于分类结果对待分类图像进行图像处理,得到待分割图像。

5、根据本公开的实施例,基于分类结果对待分类图像进行图像处理,得到待分割图像包括:在分类结果表征待分类图像为第一类图像,将字符区域图像的目标像素值进行数值转换,得到待分割图像。

6、根据本公开的实施例,上述的基于分类结果对待分类图像进行图像处理,得到待分割图像还包括:在分类结果表征待分类图像为第二类图像,将字符区域图像进行颜色空间转换,得到第二颜色空间的待处理图像,第二颜色空间的待处理图像包括至少一个分量图像信息;对待处理图像中目标分量图像信息进行剔除,得到待分割图像。

7、根据本公开的实施例,特征图像包括至少一个特征子图像,上述的从原始卡片图像中确定包含目标特征图像点的字符区域图像还包括:对特征子图像中至少一个特征图像点对应的特征值进行比较,得到待确定特征图像点;根据待确定特征图像点的图像位置信息和梯度信息对原始卡片图像中待确定特征图像点进行筛选,得到目标特征图像点;利用非极大值抑制算法从原始卡片图像中确定包含目标特征图像点的字符区域图像。

8、根据本公开的实施例,梯度信息包括表征像素变化方向的方向向量;上述的根据待确定特征图像点的图像位置信息和梯度信息对原始卡片图像中待确定特征图像点进行筛选,得到目标特征图像点包括:

9、根据目标特征图像点的图像位置信息将目标特征图像点划分,得到至少一个目标特征图像点组;

10、将目标特征点组中待确定特征图像点的方向向量进行比较,从目标特征点组中确定具有目标方向向量的目标特征图像点。

11、根据本公开的实施例,上述的对原始卡片图像进行特征提取,得到特征图像包括:对原始卡片图像进行预处理,得到预处理图像;对预处理图像中像素点的梯度信息进行特征向量化,得到特征图像。

12、根据本公开的另一个方面,提供了一种图像识别装置,包括:提取模块,用于对原始卡片图像进行特征提取,得到特征图像,特征图像包括至少一个特征图像点,特征图像点具有能够反映像素变化的特征值;确定模块,用于从原始卡片图像中确定包含目标特征图像点的字符区域图像,目标特征图像点是将至少一个特征图像点对应的特征值进行比较得到的,字符区域图像包括至少一个字符;分割模块,用于对字符区域图像进行分割处理,得到与字符对应的字符子图像;以及识别模块,用于将字符子图像输入识别模型,输出原始卡片图像的字符识别结果。

13、根据本公开的另一个方面,提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个计算机程序,其中,上述一个或多个处理器执行上述一个或多个计算机程序以实现上述方法的步骤。

14、根据本公开的另一个方面,提供了一种计算机可读存储介质,其上存储有计算机程序或指令,上述计算机程序或指令被处理器执行时实现上述方法的步骤。

15、根据本公开的另一个方面,提供了一种计算机程序产品,上述计算机程序产品包括计算机程序或指令,上述计算机程序或指令被处理器执行时实现上述方法的步骤。

16、根据本公开的实施例,通过对原始卡片图像进行特征提取,得到特征图像,特征图像包括至少一个特征图像点,特征图像点具有能够反映像素变化的特征值;从原始卡片图像中确定包含目标特征图像点的字符区域图像。由于目标特征图像点是将至少一个特征图像点对应的特征值进行比较得到的,可准确从原始卡片图像中确定包括至少一个字符的字符区域图像。再对字符区域图像进行分割处理,得到与字符对应的字符子图像;将字符子图像输入识别模型,输出原始卡片图像的字符识别结果,提高了图像中字符区域图像的检测准确性,提升原始卡片图像中字符的识别效率。

技术特征:

1.一种图像识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对所述字符区域图像进行分割处理,得到与所述字符对应的字符子图像包括:

3.根据权利要求2所述的方法,其特征在于,所述对所述字符区域图像进行像素转换,得到待分割图像包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述分类结果对所述待分类图像进行图像处理,得到所述待分割图像包括:

5.根据权利要求3所述的方法,其特征在于,所述基于所述分类结果对所述待分类图像进行图像处理,得到所述待分割图像还包括:

6.根据权利要求1所述的方法,其特征在于,所述特征图像包括至少一个特征子图像,所述从所述原始卡片图像中确定包含目标特征图像点的字符区域图像还包括:

7.根据权利要求6所述的方法,其特征在于,所述梯度信息包括表征像素变化方向的方向向量;

8.根据权利要求1所述的方法,其特征在于,所述对原始卡片图像进行特征提取,得到特征图像包括:

9.一种图像识别装置,包括:

10.一种电子设备,包括:

11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该所述计算机程序被处理器执行时实现根据权利要求1~8中任一项所述方法的步骤。

12.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现根据权利要求1~8中任一项所述方法的步骤。

技术总结本公开提供了一种图像识别方法、装置、设备、介质和程序产品,可以应用于图像识别技术、人工智能技术和金融领域。该图像识别方法包括:对原始卡片图像进行特征提取,得到特征图像,特征图像包括至少一个特征图像点,特征图像点具有能够反映像素变化的特征值;从原始卡片图像中确定包含目标特征图像点的字符区域图像,目标特征图像点是将至少一个特征图像点对应的特征值进行比较得到的,字符区域图像包括至少一个字符;对字符区域图像进行分割处理,得到与字符对应的字符子图像;将字符子图像输入识别模型,输出原始卡片图像的字符识别结果。技术研发人员:郑晓丽受保护的技术使用者:中国工商银行股份有限公司技术研发日:技术公布日:2024/8/1

本文地址:https://www.jishuxx.com/zhuanli/20240802/262091.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。