技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于全局文本识别的图像模糊度检测方法及系统与流程  >  正文

基于全局文本识别的图像模糊度检测方法及系统与流程

  • 国知局
  • 2024-10-15 09:35:30

本发明属于图像模糊检测领域,尤其涉及一种基于全局文本识别的图像模糊度检测方法及系统。

背景技术:

1、在医保理赔过程中,用户手机拍摄票据图片上传理赔系统,在后端服务器进行文本识别,提取票据信息。如果用户拍摄的图片比较模糊,那么后端识别时,会造成大量信息缺失,影响理赔效率。在这种情况下,用户拍摄的图片上传之前,对照片进行模糊度检测,就显得尤为重要。

2、票据图片的特点:文本信息多,篇幅长;现有技术的图片模糊检测算法,主要为快速傅里叶变换(fft)和拉普拉斯(laplacian)变换。这些方法,都是针对图片中的边缘信息进行检测,边缘信息越多,图片越清晰;但是,票据图片主要都是文本字符,边缘信息不显著,经过批量图片测试,使用现有技术的模糊检测算法,模糊程度检测效果欠佳。

技术实现思路

1、本发明的目的在于提供一种基于全局文本识别的图像模糊度检测方法及系统,以解决边缘信息不显著情况下有效检测票据图片模糊度的问题。

2、为实现上述发明目的之一,本发明一实施例提供一种基于全局文本识别的图像模糊度检测方法,所述方法包括,

3、采集票据图片,检测所述票据图片的票据区域并截取子图;

4、对所述子图进行文本检测获取所述子图的文本行集合;

5、对所述文本行集合进行文本识别,获取每个文本字符的置信度,将各文本行文本字符置信度的均值作为各文本行的模糊度,获取文本行模糊度集合;

6、计算所述文本行模糊度集合的均值与方差,将所述均值和方差与预设值进行比较,判定票据图片模糊度。

7、作为本发明一实施方式的进一步改进,所述方法还包括,所述检测所述票据图片的票据区域包括,

8、利用预训练的目标检测模型检测所述票据图片的票据区域,并在检测出所述票据区域后截取子图。

9、作为本发明一实施方式的进一步改进,所述方法还包括,所述截取子图包括,

10、获取票据图片中票据区域的最小外接矩形位置信息,并截取该最小外接矩形区域作为子图。

11、作为本发明一实施方式的进一步改进,所述方法还包括,所述对子图进行文本检测获取子图的文本行集合包括,

12、采用ocr文本检测模型对所述子图进行文本检测,检测出子图中所有的文本行,获取所有文本行最小外接矩形的位置信息构成子图文本行集合l={l1,l2...li...ln},li=[(xi1,yi1),(xi2,yi2),(xi3,yi3),(xi4,yi4)],其中,li表示第i个文本行最小外接矩形的位置信息,(xi1,yi1),(xi2,yi2),(xi3,yi3),(xi4,yi4)分别表示第i个文本行最小外接矩形的左上角、右上角、右下角、左下角顶点的坐标。

13、作为本发明一实施方式的进一步改进,所述方法还包括,所述对子图进行文本检测获取子图的文本行集合还包括,

14、对所述子图进行色彩空间转换、降噪、二值化、优化图像质量处理。

15、作为本发明一实施方式的进一步改进,所述方法还包括:所述对文本行集合进行文本识别包括,

16、利用ocr文本识别模型遍历文本行集合进行文本识别,识别各文本行中的每一个文本字符,并获取每一个文本字符的置信度。

17、作为本发明一实施方式的进一步改进,所述方法还包括,所述判定票据图片模糊度包括,

18、当文本行模糊度集合的均值小于预设均值,且文本行模糊度集合的方差大于预设方差时,判定票据图片模糊;

19、当文本行模糊度集合的均值小于预设值,且文本行模糊度集合的方差小于预设方差时,判定票据图片模糊;

20、当文本行模糊度集合的均值大于预设均值,且文本行模糊度集合的方差大于预设方差时,判定票据图片模糊;

21、当文本行模糊度集合的均值大于预设均值,且文本行模糊度集合的方差小于预设方差时,判定票据图片不模糊。

22、为实现上述发明目的之一,本发明一实施例还提供一种基于全局文本识别的图像模糊检测系统,所述系统包括,

23、票据图片上传模块:用于采集票据图片;

24、算法模型推理模块:用于检测票据图片的票据区域并截取子图;对子图进行文本检测获取子图的文本行集合;用于采用目标检测模型获取票据图片的票据区域并截取子图;采用文本检测模型获取子图的文本行集合;对文本行集合进行文本识别,获取每个文本字符的置信度,将各文本行文本字符置信度的均值作为各文本行的模糊度,获取文本行模糊度集合;

25、模糊度判别模块:用于计算文本行模糊度集合的均值与方差,将所述均值和方差与预设值进行比较,判定票据图片模糊度。

26、为实现上述发明目的之一,本发明一实施例还提供一种电子设备,包括存储器以及处理器,其特征在于,所述存储器中存储可在所述处理器上运行的计算机程序,所述处理器上执行程序时实现如上任意一项所述基于全局文本识别的图像模糊度检测方法中的步骤。

27、为实现上述发明目的之一,本发明一实施例还提供一种存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如上任意一项所述基于全局文本识别的图像模糊度检测方法中的步骤。

28、与现有技术相比,本发明提供的一种基于全局文本识别的图像模糊度检测方法特别针对票据图片中的文本信息进行优化处理,而非仅仅依赖于边缘信息的检测,由于票据图片通常以大篇幅的文本字符为主,这种优化使得检测更加精确和符合实际应用场景;通过神经网络模型,可以准确地提取出票据图片中的感兴趣区域,即文本字符所在的区域,有效地排除了非目标区域的信息干扰,提高了后续处理的效率和准确性;通过深度学习算法,可以精确地检测出所有文本字符,并对其进行识别,这不仅提高了识别的准确率,还使得每个字符的模糊度判断更加准确;本发明不仅对整个图片进行模糊度判断,还针对每一个文本字符进行模糊度判断;这种精细化的处理方式可以更加准确地确定票据图片的清晰度,并识别出哪些字符可能由于模糊而不可用;本发明利用深度学习,针对票据图片中的文本信息进行优化处理,提高了模糊度检测的准确性和效率,为实际应用提供了更加可靠的技术支持。

技术特征:

1.一种基于全局文本识别的图像模糊度检测方法,其特征在于:包括,

2.根据权利要求1所述的基于全局文本识别的图像模糊度检测方法,其特征在于:所述检测所述票据图片的票据区域包括,

3.根据权利要求1或2所述的基于全局文本识别的图像模糊度检测方法,其特征在于:所述截取子图包括,

4.根据权利要求1所述的基于全局文本识别的图像模糊度检测方法,其特征在于:所述对子图进行文本检测获取子图的文本行集合包括,

5.根据权利要求1或4所述的基于全局文本识别的图像模糊度检测方法,其特征在于:所述对子图进行文本检测获取子图的文本行集合还包括,

6.根据权利要求1所述的基于全局文本识别的图像模糊度检测方法,其特征在于:所述对所述文本行集合进行文本识别包括,

7.根据权利要求1所述的基于全局文本识别的图像模糊度检测方法,其特征在于:所述判定票据图片模糊度包括,

8.一种基于全局文本识别的图像模糊度检测系统,其特征在于:包括,

9.一种电子设备,包括存储器以及处理器,其特征在于:所述存储器中存储可在所述处理器上运行的计算机程序,所述处理器上执行程序时实现如权利要求1~7任意一项所述基于全局文本识别的图像模糊度检测方法中的步骤。

10.一种存储介质,所述存储介质存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现如权利要求1~7任意一项所述基于全局文本识别的图像模糊度检测方法中的步骤。

技术总结本发明涉及一种基于全局文本识别的图像模糊度检测方法及系统,包括采集票据图片,检测票据图片的票据区域并截取子图;对子图进行文本检测获取子图的文本行集合;对文本行集合进行文本识别,获取每个文本字符的置信度,将各文本行文本字符置信度的均值作为各文本行的模糊度,获取文本行模糊度集合;计算文本行模糊度集合的均值与方差,将均值和方差与预设值进行比较,判定票据图片模糊度。本发明不仅对整个图片进行模糊度判断,还针对每一个文本字符进行模糊度判断;这种精细化的处理方式可以更加准确地确定票据图片的清晰度,并识别出哪些字符可能由于模糊而不可用。技术研发人员:王步宜,苗伟,常博,马杰,孙召敏,邢鑫,李文孝,沈义晖受保护的技术使用者:南京市智慧医疗投资运营服务有限公司技术研发日:技术公布日:2024/10/10

本文地址:https://www.jishuxx.com/zhuanli/20241015/314646.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。