一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文字识别方法、装置、电子设备和介质与流程

2022-08-03 01:27:00 来源:中国专利 TAG:

技术特征:
1.一种文字识别方法,包括:在第一图像中获取包含待识别的文本行的第一区域;对所述第一区域进行单字检测,以确定所述文本行中的每一个单字对应的第一位置信息;基于所述第一位置信息,确定每一个单字对应的类别;基于所述类别,确定所述第一区域中的块区域以及所述块区域对应的第二位置信息;基于所述块区域以及对应的所述第二位置信息,生成第二图像;以及对所述第二图像进行文字识别。2.根据权利要求1所述的方法,还包括:获取待检测图像;以及对所述待检测图像进行文本行检测,以得到所述第一图像。3.根据权利要求1或2所述的方法,其中,所述文本行中的每一个单字对应的第一位置信息包括包含该单字的最小竖直矩形框的边界在所述第一区域中的坐标值。4.根据权利要求1-3中任一项所述的方法,其中,所述基于所述第一位置信息,确定每一个单字对应的类别包括:基于所述文本行中的每一个单字对应的第一位置信息,确定高度阈值;以及针对所述文本行中的每一个单字,基于该单字的高度与所述高度阈值的比较,将该单字确定为第一类别或第二类别。5.根据权利要求1-4中任一项所述的方法,其中,所述基于所述类别,确定所述第一区域中的块区域以及所述块区域对应的第二位置信息包括:将满足以下任一条件的至少一个单字划分在一起作为块区域,并确定所述第一区域中的至少一个块区域:多个连续第一类别的单字、多个连续第二类别的单字、以及多个第二类别的单字之间存在不超过一个第一类别的单字;针对所述至少一个块区域中位于所述第一区域左边缘的第一个块区域,基于所述第一个块区域中的各单字对应的第一位置信息,确定所述第一个块区域对应的第二位置信息;以及针对所述至少一个块区域中除所述第一个块区域之外的其余块区域中的每一个块区域,基于该块区域中的各单字对应的第一位置信息以及位于该块区域之前的块区域对应的第二位置信息,确定该块区域对应的第二位置信息。6.一种文字识别装置,包括:第一获取模块,被配置为在第一图像中获取包含待识别的文本行的第一区域;第一确定模块,对所述第一区域进行单字检测,以确定所述文本行中的每一个单字对应的第一位置信息;第二确定模块,被配置为基于所述第一位置信息,确定每一个单字对应的类别;第三确定模块,被配置为基于所述类别,确定所述第一区域中的块区域以及所述块区域对应的第二位置信息;第四确定模块,被配置为基于所述块区域以及对应的所述第二位置信息,生成第二图像;以及识别模块,被配置为对所述第二图像进行文字识别。
7.根据权利要求6所述的装置,还包括:第二获取模块,被配置为获取待检测图像;以及检测模块,被配置为对所述待检测图像进行文本行检测,以得到所述第一图像。8.根据权利要求6或7所述的装置,其中,所述文本行中的每一个单字对应的第一位置信息包括包含该单字的最小竖直矩形框的边界在所述第一区域中的坐标值。9.根据权利要求6-8中任一项所述的装置,其中,所述第二确定模块包括:第一确定单元,被配置为基于所述文本行中的每一个单字对应的第一位置信息,确定高度阈值;以及第二确定单元,被配置为针对所述文本行中的每一个单字,基于该单字的高度与所述高度阈值的比较,将该单字确定为第一类别或第二类别。10.根据权利要求6-9中任一项所述的装置,其中,所述第三确定模块包括:第三确定单元,被配置为将满足以下任一条件的至少一个单字划分在一起作为块区域,并确定所述第一区域中的至少一个块区域:多个连续第一类别的单字、多个连续第二类别的单字、以及多个第二类别的单字之间存在不超过一个第一类别的单字;第四确定单元,被配置为针对所述至少一个块区域中位于所述第一区域左边缘的第一个块区域,基于所述第一个块区域中的各单字对应的第一位置信息,确定所述第一个块区域对应的第二位置信息;以及第五确定单元,被配置为针对所述至少一个块区域中除所述第一个块区域之外的其余块区域中的每一个块区域,基于该块区域中的各单字对应的第一位置信息以及位于该块区域之前的块区域对应的第二位置信息,确定该块区域对应的第二位置信息。11.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-5中任一项所述的方法。12.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-5中任一项所述的方法。13.一种计算机程序产品,包括计算机程序,其中,所述计算机程序在被处理器执行时实现权利要求1-5中任一项所述的方法。

技术总结
本公开提供了一种文字识别方法、装置、电子设备和介质,涉及人工智能技术领域,尤其涉及文本识别技术领域。实现方案为:在第一图像中获取包含待识别的文本行的第一区域;对第一区域进行单字检测,以确定文本行中的每一个单字对应的第一位置信息;基于第一位置信息,确定每一个单字对应的类别;基于类别,确定第一区域中的块区域以及块区域对应的第二位置信息;基于块区域以及对应的第二位置信息,生成第二图像;以及对第二图像进行文字识别。以及对第二图像进行文字识别。以及对第二图像进行文字识别。


技术研发人员:乔美娜 刘珊珊 吴亮 章成全 姚锟
受保护的技术使用者:北京百度网讯科技有限公司
技术研发日:2022.05.09
技术公布日:2022/8/1
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献