技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种文档图像文字颜色加深方法、装置及计算机设备与流程  >  正文

一种文档图像文字颜色加深方法、装置及计算机设备与流程

  • 国知局
  • 2024-10-15 09:39:35

本申请涉及文档数据处理,具体涉及一种文档图像文字颜色加深方法、装置及计算机设备。

背景技术:

1、在档案、卷宗等文档的扫描、拍摄或数字化处理过程中,常常会面临文档图像颜色过浅的问题。这种情况通常是由于多种因素引起的,例如:纸质文件本身质量不佳,或者扫描仪、拍照机在成像时设置不当。颜色过浅的文档不仅会显著影响用户的阅读体验,使得文字和图像的对比度降低,难以清晰辨认,特别是对于背景浅色或字迹细小的文件而言,更为明显。此外,对于需要进行后续光学字符识别(ocr)等处理技术的文档来说,颜色过浅的图像可能会导致识别错误或误识别的问题。这些技术依赖于图像的质量和清晰度来准确地识别文本内容,因此,颜色过浅的文档可能会使得ocr算法无法正确分辨字符或单词,从而引入数据处理的错误。

2、针对文档图像颜色过浅的问题现有技术大多数是通过对整个图像进行全局手动处理,即通过调整图像的亮度、对比度来对图像进行伽玛校正。但是,这种全局手动处理方式可能会导致图像的关键区域(例如印章、手印等)的颜色失真,从而影响信息的完整性和真实性;另外,这种图像处理方法在调整图像的亮度、对比度时,需要人工干预,无法自动判断图像的当前亮度和对比度是否合适,导致处理效率较低。

技术实现思路

1、为此,本申请提供一种文档图像文字颜色加深方法、装置及计算机设备,以解决现有技术存在的颜色增强技术对整个图像进行全局处理时会导致关键区域颜色失真的问题。

2、为了实现上述目的,本申请提供如下技术方案:

3、第一方面,一种文档图像文字颜色加深方法,包括:

4、步骤1:获取文档图像数据;

5、步骤2:利用预先训练好的深度学习模型检测所述文档图像数据中的印章和指纹区域;

6、步骤3:通过图像分割技术分割检测出来的所述印章和指纹区域;

7、步骤4:记录所述印章和指纹区域的原始颜色信息,并利用颜色保护算法保护所述印章和指纹区域的原始颜色信息;

8、步骤5:利用预先训练好的机器学习模型预测所述文档图像数据的对比度、亮度和伽马指数的调整参数;

9、步骤6:根据所述调整参数调整所述文档图像数据的全局对比度、亮度和伽马指数,并根据分割出来的所述印章和指纹区域、记录的所述印章和指纹区域的原始颜色信息还原印章和指纹。

10、作为优选,所述步骤2中,所述深度学习模型的训练过程具体包括:

11、步骤201:获取各种场景、光照条件和清晰度的图像数据集;

12、步骤202:清洗所述图像数据集,并对所述图像数据集中的印章和指纹进行标注,得到标注后的图像;

13、步骤203:根据标注后的图像筛选出包含印章和指纹的图像,并进行分类,得到分类后的图像;

14、步骤204:进一步清洗分类后的图像,并调整图像的大小和分辨率,然后输入到深度学习模型中进行训练,从而得到训练好的深度学习模型。

15、作为优选,所述步骤202中,清洗所述图像数据集时包括去除重复、模糊、低质量或损坏的图像,并修正图像的格式、分辨率和编码。

16、作为优选,所述步骤204中,进一步清洗分类后的图像时包括去除印章或指纹模糊、不完整或受到严重干扰的图像,并调整图像的大小和分辨率。

17、作为优选,所述步骤3中,所述图像分割技术采用语义分割或实例分割。

18、作为优选,所述步骤5中,所述机器学习模型的训练过程具体包括:

19、步骤501:获取各种场景、光照条件和清晰度的图像数据集;

20、步骤502:清洗所述图像数据集,并标注所述图像数据集中图像的对比度、亮度和伽马指数,得到标注后的图像;

21、步骤503:从标注后的图像中提取图像的对比度、亮度和伽马指数,并输入到机器学习模型中进行训练,从而得到训练好的机器学习模型。

22、第二方面,一种文档图像文字颜色加深装置,包括:

23、图像数据获取模块,用于获取文档图像数据;

24、印章指纹检测模块,用于利用预先训练好的深度学习模型检测所述文档图像数据中的印章和指纹区域;

25、印章指纹分割模块,用于通过图像分割技术分割检测出来的所述印章和指纹区域;

26、印章指纹颜色保护模块,用于记录所述印章和指纹区域的原始颜色信息,并利用颜色保护算法保护所述印章和指纹区域的原始颜色信息;

27、调整参数预测模块,用于利用预先训练好的机器学习模型预测所述文档图像数据的对比度、亮度和伽马指数的调整参数;

28、图像增强模块,用于根据所述调整参数调整所述文档图像数据的全局对比度、亮度和伽马指数,并根据分割出来的所述印章和指纹区域、记录的所述印章和指纹区域的原始颜色信息还原印章和指纹。

29、第三方面,一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现一种文档图像文字颜色加深方法的步骤。

30、第四方面,一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现一种文档图像文字颜色加深方法的步骤。

31、第五方面,一种计算机程序产品,包括计算机程序或指令,该计算机程序或指令被处理器执行时实现一种文档图像文字颜色加深方法的步骤。

32、相比现有技术,本申请至少具有以下有益效果:

33、本申请提供了一种文档图像文字颜色加深方法、装置及计算机设备,方法包括:获取文档图像数据;利用预先训练好的深度学习模型检测文档图像数据中的印章和指纹区域;通过图像分割技术分割检测出来的印章和指纹区域;记录印章和指纹区域的原始颜色信息,并利用颜色保护算法保护印章和指纹区域的原始颜色信息;利用预先训练好的机器学习模型预测文档图像数据的对比度、亮度和伽马指数的调整参数;根据调整参数调整文档图像数据的全局对比度、亮度和伽马指数,并根据分割出来的印章和指纹区域、记录的印章和指纹区域的原始颜色信息还原印章和指纹。本申请通过检测并分割出关键区域,实现了局部关键区域的颜色保护,避免了全局处理带来的关键区域颜色失真问题,提高了图像处理的质量和准确性。

技术特征:

1.一种文档图像文字颜色加深方法,其特征在于,包括:

2.根据权利要求1所述的文档图像文字颜色加深方法,其特征在于,所述步骤2中,所述深度学习模型的训练过程具体包括:

3.根据权利要求2所述的文档图像文字颜色加深方法,其特征在于,所述步骤202中,清洗所述图像数据集时包括去除重复、模糊、低质量或损坏的图像,并修正图像的格式、分辨率和编码。

4.根据权利要求2所述的文档图像文字颜色加深方法,其特征在于,所述步骤204中,进一步清洗分类后的图像时包括去除印章或指纹模糊、不完整或受到严重干扰的图像,并调整图像的大小和分辨率。

5.根据权利要求1所述的文档图像文字颜色加深方法,其特征在于,所述步骤3中,所述图像分割技术采用语义分割或实例分割。

6.根据权利要求1所述的文档图像文字颜色加深方法,其特征在于,所述步骤5中,所述机器学习模型的训练过程具体包括:

7.一种文档图像文字颜色加深装置,其特征在于,包括:

8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至6中任一项所述的方法的步骤。

9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

10.一种计算机程序产品,包括计算机程序或指令,其特征在于,该计算机程序或指令被处理器执行时实现权利要求1至6中任一项所述的方法的步骤。

技术总结本申请公开了一种文档图像文字颜色加深方法、装置及计算机设备,方法包括:获取文档图像数据;利用预先训练好的深度学习模型检测文档图像数据中的印章和指纹区域,并通过图像分割技术分割印章和指纹区域;记录印章和指纹区域的原始颜色信息,并利用颜色保护算法进行保护;利用预先训练好的机器学习模型预测文档图像数据的对比度、亮度和伽马指数的调整参数;根据调整参数调整文档图像数据的全局对比度、亮度和伽马指数,并根据分割出来的印章和指纹区域、记录的印章和指纹区域的原始颜色信息还原印章和指纹。本申请实现了局部关键区域的颜色保护,避免了全局处理带来的关键区域颜色失真问题,提高了图像处理的质量和准确性。技术研发人员:王荣刚受保护的技术使用者:北京汉王影研科技有限公司技术研发日:技术公布日:2024/10/10

本文地址:https://www.jishuxx.com/zhuanli/20241015/314899.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。