一种信息处理方法、装置及设备与流程
- 国知局
- 2024-08-05 11:43:11
本发明涉及文本信息处理,特别是指一种信息处理方法、装置及设备。
背景技术:
1、在文本获取的过程中,多种因素会影响最终文本的质量,比如打印机和扫描仪的成像质量会影响最终扫描图像的质量;利用手机拍照文档的过程中,轻微的抖动会导致图像中的字迹变虚,这些文档照片通过阈值算法转化为二值图像后,会出现大量的笔画断裂导致字体结构不完整的现象出现。尤其在特殊的场合下,例如含有隐秘信息的机密文档通过截屏或拍照的方式被非法窃取,为了躲避被溯源追踪,拍摄的文本经过恶意毁坏处理,图像质量变得更加恶劣,经过处理后的二值图像会出现大量笔画断裂或完全丢失的现象,这为文本泄密溯源追踪工作带来很大的困难。
技术实现思路
1、本发明要解决的技术问题是提供一种信息处理方法、装置及设备,以实现对文本中字符缺失笔画的修复,提高文本处理的视觉质量及效率。
2、为解决上述技术问题,本发明的实施例提供一种信息处理方法,包括:
3、获取待处理文本图像;
4、确定所述待处理文本图像中字符对应的标准字符图像;
5、确定所述标准字符图像的目标区域;
6、根据所述目标区域,确定所述待处理文本图像中字符的笔画缺失区域;
7、对所述笔画缺失区域进行补充处理,获得所述笔画缺失区域对应字符的目标字符块图像;
8、根据所述目标字符块图像以及所述待处理文本的二值化文本图像,获得所述待处理文本图像的目标文本图像。
9、可选的,确定所述待处理文本图像中字符对应的标准字符图像本,包括:
10、根据所述待处理文本图像中的每个字符的字体类型以及字符编码,生成所述待处理文本图像中每个字符对应的目标字符图像。
11、可选的,确定所述标准字符图像的目标区域,包括:
12、沿所述标准字符图像的骨架线对所述骨架线上的所有像素点进行遍历,获得所述标准字符图像中标准字符的笔画路径集合;
13、将所述笔画路径集合中的每一条笔画路径上的预设n个连续的像素点确定为第一区域,并获得所述标准字符图像的至少一个第一区域,n为正整数;
14、根据所述第一区域中所述预设n个连续的像素点中的第一个像素点、最后一个像素点的坐标以及所述第一区域预设边界阈值,确定所述第一区域的目标区域。
15、可选的,根据所述目标区域,确定所述待处理文本图像中字符的笔画缺失区域,包括:
16、获取所述待处理文本图像的至少一个子图像块,每个所述子图像块中均包含有所述待处理文本图像中的一个字符;
17、将至少一个所述目标区域映射到与所述目标区域对应的所述子图像块中,获得所述待处理文本图像中每个子图像块的至少一个第二区域;
18、根据至少一个所述子图像块中字符的笔画走势以及至少一个所述第二区域中像素点的坐标,确定至少一个所述第二区域中的笔画缺失区域。
19、可选的,根据至少一个所述子图像块中字符的笔画走势以及至少一个所述第二区域中像素点的坐标,确定至少一个所述第二区域中的笔画缺失区域,包括:
20、当所述子图像块中字符的笔画走势为第一走势时,在所述第二区域内若存在任一第一像素点满足:
21、
22、则确定当前第二区域内的笔画存在缺失,确定当前第二区域为所述笔画缺失区域;
23、其中,ai、bi表示第一像素点的坐标,s1(ai,bi)≠0表示第一像素点在当前坐标下的灰度值不为0,tl(z)表示当前第二区域的左边界阈值,tl(y)表示当前第二区域的右边界阈值,tl(s)表示当前第二区域的上边界阈值,tl(x)表示当前第二区域的下边界阈值。
24、可选的,根据至少一个所述子图像块中字符的笔画走势以及至少一个所述第二区域中像素点的坐标,确定至少一个所述第二区域中的笔画缺失区域,包括:
25、当所述子图像块中字符的笔画走势为第二走势时,在所述第二区域内若存在任一第二像素点满足:
26、
27、则确定当前第二区域内的笔画存在缺失,确定当前第二区域为所述笔画缺失区域;
28、其中,aj、bj表示第二像素点的坐标,s2(aj,bj)≠0表示第二像素点在当前坐标下的灰度值不为0,tl(z)表示当前第二区域的左边界阈值,tl(y)表示当前第二区域的右边界阈值,tl(s)表示当前第二区域的上边界阈值,tl(x)表示当前第二区域的下边界阈值。
29、可选的,对所述笔画缺失区域进行补充处理,获得所述笔画缺失区域对应字符的目标字符图像块,包括:
30、获取所述待处理文本图像的二值化阈值;
31、将所述二值化阈值作为起始阈值,对所述笔画缺失区域进行迭代二值化处理,直到迭代二值化处理后所述笔画缺失区域的字符笔画完整或者迭代二值化处理后所述笔画缺失区域对应的字符图像的二值化阈值达到最大灰度为止,获得所述笔画缺失区域对应字符的目标字符图像块。
32、本发明的实施例还提供一种信息处理装置,包括:
33、获取模块,用于获取待处理文本图像;
34、处理模块,用于确定所述待处理文本图像中字符对应的标准字符图像;确定所述标准字符图像的目标区域;根据所述目标区域,确定所述待处理文本图像中字符的笔画缺失区域;对所述笔画缺失区域进行补充处理,获得所述笔画缺失区域对应字符的目标字符块图像;根据所述目标字符块图像以及所述待处理文本图像的二值化文本图像,获得所述待处理文本图像的目标文本图像。
35、本发明的实施例还提供一种计算设备,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如上述所述的方法。
36、本发明的实施例还提供一种计算机可读存储介质,存储指令,当所述指令在计算机上运行时,使得计算机执行如上述所述的方法。
37、本发明的上述方案至少包括以下有益效果:
38、通过获取待处理文本图像;并确定所述待处理文本图像中字符对应的标准字符图像;确定所述标准字符图像的目标区域;根据所述目标区域,确定所述待处理文本图像中字符的笔画缺失区域;对所述笔画缺失区域进行补充处理,获得所述笔画缺失区域对应字符的目标字符块图像;根据所述目标字符块图像以及所述待处理文本的二值化文本图像,获得所述待处理文本图像的目标文本图像,以实现对文本中字符缺失笔画的修复,提高文本处理的视觉质量及效率。
技术特征:1.一种信息处理方法,其特征在于,包括:
2.根据权利要求1所述的信息处理方法,其特征在于,确定所述待处理文本图像中字符对应的标准字符图像本,包括:
3.根据权利要求1所述的信息处理方法,其特征在于,确定所述标准字符图像的目标区域,包括:
4.根据权利要求1所述的信息处理方法,其特征在于,根据所述目标区域,确定所述待处理文本图像中字符的笔画缺失区域,包括:
5.根据权利要求4所述的信息处理方法,其特征在于,根据至少一个所述子图像块中字符的笔画走势以及至少一个所述第二区域中像素点的坐标,确定至少一个所述第二区域中的笔画缺失区域,包括:
6.根据权利要求4所述的信息处理方法,其特征在于,根据至少一个所述子图像块中字符的笔画走势以及至少一个所述第二区域中像素点的坐标,确定至少一个所述第二区域中的笔画缺失区域,包括:
7.根据权利要求1所述的信息处理方法,其特征在于,对所述笔画缺失区域进行补充处理,获得所述笔画缺失区域对应字符的目标字符图像块,包括:
8.一种信息处理装置,其特征在于,包括:
9.一种计算设备,其特征在于,包括:处理器、存储有计算机程序的存储器,所述计算机程序被处理器运行时,执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,存储指令,当所述指令在计算机上运行时,使得计算机执行如权利要求1至7任一项所述的方法。
技术总结本发明提供一种信息处理方法、装置及设备,其中,所述方法包括:获取待处理文本图像;确定所述待处理文本图像中字符对应的标准字符图像;确定所述标准字符图像的目标区域;根据所述目标区域,确定所述待处理文本图像中字符的笔画缺失区域;对所述笔画缺失区域进行补充处理,获得所述笔画缺失区域对应字符的目标字符块图像;根据所述目标字符块图像以及所述待处理文本图像的二值化文本图像,获得所述待处理文本图像的目标文本图像。本发明提供的方案可以实现对文本中字符缺失笔画的修复,提高文本处理的视觉质量及效率。技术研发人员:丛升日,李公宝受保护的技术使用者:北京国隐科技有限公司技术研发日:技术公布日:2024/8/1本文地址:https://www.jishuxx.com/zhuanli/20240802/258997.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表