一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于目标检测的票据识别方法、装置、电子设备、介质与流程

2022-06-25 14:25:52 来源:中国专利 TAG:


1.本发明属于人工智能技术领域,尤其涉及一种基于目标检测的票据识别方法、装置、电子设备、介质。


背景技术:

2.目前,随着电子办公的发展,越来越多的纸质票据需要录入电子系统,人工录入的方式已经不能满足当今的需求,利用光学字符识别(optical character recognition,ocr)技术从票据图像中提取出票据信息,是自动化系统的发展方向。票据图像常见的录入方式有扫描或者拍照,由于每种票据的票据信息都具有特定的排版方式,因此票据信息的识别位置是固定的,为了确保票据识别的准确性,若在拍照或扫描时确保票据方向不正,识别位置对应的区域并不存在对应的票据信息,影响票据识别的准确率。


技术实现要素:

3.以下是对本文详细描述的主题的概述。本概述并非是为了限制权利要求的保护范围。
4.本发明实施例提供了一种基于目标检测的票据识别方法、装置、电子设备、介质,能够在票据图像中调整票据图像的方向,确保票据识别的准确率。
5.第一方面,本发明实施例提供了一种基于目标检测的票据识别方法,包括:
6.获取待识别的票据图像,将所述票据图像输入预先训练好的目标检测模型;
7.通过所述目标检测模型从所述票据图像中确定目标票据的票据区域,以及所述目标票据的参考标识的标识区域;
8.确定所述票据区域的票据中心坐标和所述标识区域的标识中心坐标,根据所述票据中心坐标和所述标识中心坐标确定所述目标票据在所述票据图像中的偏移角度;
9.根据所述偏移角度和预设的基准角度确定目标调整信息,根据所述目标调整信息调整所述票据图像,得到目标图像;
10.对所述目标图像进行ocr识别处理,得到所述目标票据的票据信息。
11.在一些实施例中,所述通过所述目标检测模型从所述票据图像中确定目标票据的票据区域,以及所述目标票据的参考标识的标识区域,包括:
12.通过所述目标检测模型从所述票据图像中确定多个票据候选区域和多个标识候选区域;
13.当所述票据候选区域和所述标识候选区域的交并比为1,将所对应的所述票据候选区域确定为所述目标票据的票据区域,将所对应的所述标识候选区域确定为所述参考标识的标识区域。
14.在一些实施例中,在所述通过所述目标检测模型从所述票据图像中确定多个票据候选区域和多个标识候选区域之前,所述方法还包括:
15.从所述票据图像中确定所述目标票据的票据类型;
16.根据所述票据类型确定所述目标票据的所述参考标识。
17.在一些实施例中,所述根据所述票据中心坐标和所述标识中心坐标确定所述目标票据在所述票据图像中的偏移角度,通过以下公式得到:
[0018][0019]
其中,angle
reflect
为所述偏移角度,center(x,y)
ref
为所述标识中心坐标,center(x,y)
tar
为所述票据中心坐标。
[0020]
在一些实施例中,所述根据所述偏移角度和预设的基准角度确定目标调整信息,包括:
[0021]
确定所述偏移角度和所述基准角度之间的目标角度差,根据所述目标角度差确定目标旋转角度和目标旋转方向;
[0022]
将所述目标旋转角度和所述目标旋转方向确定为所述目标调整信息。
[0023]
在一些实施例中,所述基准角度的数量至少为二,所述确定所述偏移角度和所述基准角度之间的角度差,根据所述角度差确定目标旋转角度和目标旋转方向,包括:
[0024]
根据所述偏移角度和多个所述基准角度确定多个候选角度差;
[0025]
将绝对值最小的所述候选角度差确定为所述目标角度差;
[0026]
当所述目标角度差为正数,确定所述目标旋转方向为顺时针,当所述目标角度差为负数,确定所述目标旋转方向为逆时针。
[0027]
在一些实施例中,所述目标检测模型通过以下方法训练得到:
[0028]
获取多张样本票据图像,所述样本票据图像预先标注有标注信息,所述标注信息包括标注票据区域和标注标识区域;
[0029]
将多张所述样本票据图像输入至所述目标检测模型,将所述目标检测模型训练至收敛。
[0030]
第二方面,本发明实施例提供了一种基于目标检测的票据识别装置,包括:
[0031]
图像获取单元,用于获取待识别的票据图像,将所述票据图像输入预先训练好的目标检测模型;
[0032]
检测单元,用于通过所述目标检测模型从所述票据图像中确定目标票据的票据区域,以及所述目标票据的参考标识的标识区域;
[0033]
定位单元,用于确定所述票据区域的票据中心坐标和所述标识区域的标识中心坐标,根据所述票据中心坐标和所述标识中心坐标确定所述目标票据在所述票据图像中的偏移角度;
[0034]
图像调整单元,用于根据所述偏移角度和预设的基准角度确定目标调整信息,根据所述目标调整信息调整所述票据图像,得到目标图像;
[0035]
识别单元,用于对所述目标图像进行ocr识别处理,得到所述目标票据的票据信息。
[0036]
第三方面,本发明实施例提供了一种电子设备,包括:存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如第一方面所述的基于目标检测的票据识别方法。
[0037]
第四方面,本发明实施例提供了一种计算机可读存储介质,存储有计算机程序,所
述计算机程序用于执行如第一方面所述的基于目标检测的票据识别方法。
[0038]
本发明实施例包括:获取待识别的票据图像,将所述票据图像输入预先训练好的目标检测模型;通过所述目标检测模型从所述票据图像中确定目标票据的票据区域,以及所述目标票据的参考标识的标识区域;确定所述票据区域的票据中心坐标和所述标识区域的标识中心坐标,根据所述票据中心坐标和所述标识中心坐标确定所述目标票据在所述票据图像中的偏移角度;根据所述偏移角度和预设的基准角度确定目标调整信息,根据所述目标调整信息调整所述票据图像,得到目标图像;对所述目标图像进行ocr识别处理,得到所述目标票据的票据信息。根据本实施例的技术方案,能够通过目标检测模型确定目标票据和参考标识的区域,并根据得到的目标调整信息将目标票据调整至正向,确保了ocr识别处理能够正确获取到票据信息,有效提高票据识别的成功率和准确性。
[0039]
本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所特别指出的结构来实现和获得。
附图说明
[0040]
附图用来提供对本发明技术方案的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明的技术方案,并不构成对本发明技术方案的限制。
[0041]
图1是本发明一个实施例提供的基于目标检测的票据识别方法的流程图;
[0042]
图2是本发明另一个实施例提供的票据图像的示意图;
[0043]
图3是本发明另一个实施例提供的确定票据区域和标识区域的流程图;
[0044]
图4是本发明另一个实施例提供的确定参考标识的流程图;
[0045]
图5是本发明另一个实施例提供的确定目标调整信息的流程图;
[0046]
图6是本发明另一个实施例提供的根据多个基准角度确定目标调整信息的示意图;
[0047]
图7是本发明另一个实施例提供的训练目标检测模型的流程图;
[0048]
图8是本发明另一个实施例提供的基于目标检测的票据识别装置的结构图;
[0049]
图9是本发明另一个实施例提供的电子设备的装置图。
具体实施方式
[0050]
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
[0051]
需要说明的是,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。说明书、权利要求书或上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。
[0052]
本发明提供了一种基于目标检测的票据识别方法、装置、电子设备、介质,方法包括:获取待识别的票据图像,将所述票据图像输入预先训练好的目标检测模型;通过所述目标检测模型从所述票据图像中确定目标票据的票据区域,以及所述目标票据的参考标识的
标识区域;确定所述票据区域的票据中心坐标和所述标识区域的标识中心坐标,根据所述票据中心坐标和所述标识中心坐标确定所述目标票据在所述票据图像中的偏移角度;根据所述偏移角度和预设的基准角度确定目标调整信息,根据所述目标调整信息调整所述票据图像,得到目标图像;对所述目标图像进行ocr识别处理,得到所述目标票据的票据信息。根据本实施例的技术方案,能够通过目标检测模型确定目标票据和参考标识的区域,并根据得到的目标调整信息将目标票据调整至正向,确保了ocr识别处理能够正确获取到票据信息,有效提高票据识别的成功率和准确性。
[0053]
本技术实施例可以基于人工智能技术对相关的数据进行编译、获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用装置。
[0054]
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互装置、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
[0055]
机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
[0056]
计算机视觉技术(computer vision,cv)是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、ocr、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3d技术、虚拟现实、增强现实、同步定位与地图构建、自动驾驶、智慧交通等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
[0057]
需要说明的是,本发明实施例的数据可以保存在服务器中,服务器可以是独立的服务器,也可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
[0058]
ocr是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符,通过检测暗、亮的模式确定其形状,然后用字符识别方法将形状翻译成计算机文字的过程。
[0059]
如图1所示,图1是本发明一个实施例提供的一种基于目标检测的票据识别方法的流程图,该基于目标检测的票据识别方法包括但不限于有以下步骤:
[0060]
步骤s110,获取待识别的票据图像,将票据图像输入预先训练好的目标检测模型;
[0061]
步骤s120,通过目标检测模型从票据图像中确定目标票据的票据区域,以及目标
票据的参考标识的标识区域;
[0062]
步骤s130,确定票据区域的票据中心坐标和标识区域的标识中心坐标,根据票据中心坐标和标识中心坐标确定目标票据在票据图像中的偏移角度;
[0063]
步骤s140,根据偏移角度和预设的基准角度确定目标调整信息,根据目标调整信息调整票据图像,得到目标图像;
[0064]
步骤s150,对目标图像进行ocr识别处理,得到目标票据的票据信息。
[0065]
需要说明的是,由于票据图像的录入方式可以是拍照或者扫描,以拍照为例,很难确保拍摄框与票据完全对齐,即便是采用位置固定的高拍仪进行拍摄,操作人员在将票据放上拍摄区时也可能发生偏移,目标票据在票据图像中偏移的示例可以参考图2所示,在图2所示的票据图像200中,目标票据211与票据图像200的边框呈一定的偏移角度,此时若采用目标票据的预设样式进行ocr识别,由于区域不符合或者文字倾斜,很可能出现识别错误,影响票据识别的准确性,为了解决这个问题,需要对目标票据的偏移进行矫正,以确保能够对票据图像进行常规的ocr识别。
[0066]
需要说明的是,由于目标票据在票据图像中存在一定的偏移,因此票据图像并非全部内容都是目标票据,本实施例通过目标检测模型对目标票据的票据区域进行检测,以确定例如,在图2所示的票据图像200中,通过目标检测模型可以确定目标票据211的票据区域212,针对票据区域212进行后续处理,能够有效排除背景图像对票据识别的干扰。
[0067]
需要说明的是,对于图像进行目标检测的过程可以通过深度学习算法实现,例如通过基于卷积神经网络特征的区域算法(r-cnn)、基于卷积神经网络特征的快速区域算法(faster r-cnn)等二阶段(two-stage)目标检测算法实现,或者可以通过一瞥目标检测算法(you only look once,yolo)、单镜头多盒检测器算法(single shot multibox detector,ssd)等一阶段(one-stage)目标检测算法实现,具体的算法可以根据实际需求选取,本实施例对此不做过多限定。
[0068]
需要说明的是,参考标识可以根据不同的票据类型进行确定,例如对于大部分票据都存在印章,且印章的位置是相对固定的,例如图2所示,以目标票据211的上方中部的参考标识231为例,在目标检测模型的训练过程中,可以预先设定好印章为参考标识,并且在样本图像中标注出相应的区域,使得目标检测模型在获取到图2所示的票据图像200之后,能够从票据区域212中进行二次目标检测,确定印章231的标识区域232。
[0069]
需要说明的是,本实施例在确定标识区域和票据区域之后,从标识区域确定标识中心坐标,从票据区域确定票据中心坐标,由于参考标识的位置通常固定,标识中心坐标和票据中心坐标之间的线段与票据图像的垂直线或者平行线之间的夹角与目标票据的偏移角度正相关,例如图2所示,标识中心坐标和票据中心坐标之间的中心参考线221和平行于票据图像200上下两侧的水平参考线222之间形成夹角α,当目标票据的位置为正向,α为90度,因此,当确定偏移角度之后,能够以90度为基准角度,确定矫正目标票据所需要调整的角度和方向,即目标调整信息。根据上述技术方案,无论目标票据在票据图像中的摆放位置如何,都可以通过偏移角度确定目标调整信息,从而将目标票据调整成正向,从而通过常规的ocr识别从票据图像中识别出票据信息。
[0070]
需要说明的是,偏移角度的确定方式可以根据实际需求选取,如图2所示,根据水平参考线222和中心参考线221确定偏移角度,基准角度为90度,例如计算出的偏移角度为
95度,则偏移角度为5度,具体计算方式可以根据基准角度的选取和参考线确定,在此不多作限定。目标调整信息可以包括旋转角度和旋转方向,例如逆时针旋转5度,顺时针旋转25度等,目标调整信息的具体形式在此不多作限定。
[0071]
需要说明的是,在根据目标调整信息得到目标图像后,目标图像中的目标票据已经被调整至正向,则可以根据常规的ocr识别技术,针对目标票据进行票据识别得到票据信息,具体的识别过程并非本实施例做出的改进,在此不多作赘述。
[0072]
另外,在一实施例中,参考图3,图1所示实施例的步骤s120还包括但不限于有以下步骤:
[0073]
步骤s310,通过目标检测模型从票据图像中确定多个票据候选区域和多个标识候选区域;
[0074]
步骤s320,当票据候选区域和标识候选区域的交并比为1,将所对应的票据候选区域确定为目标票据的票据区域,将所对应的标识候选区域确定为参考标识的标识区域。
[0075]
需要说明的是,为了提高票据识别的效率,票据图像中可能同时录入多张票据,例如以多张票据依次排列的方式进行图像录入,通过识别系统分别对每一张票据进行票据识别,得到多个票据信息,而为了对票据的角度进行矫正,可以针对每一张票据独立执行本实施例的技术方案,即确定每一张票据的偏移角度,由于偏移角度的确定依赖于参考标识和目标票据固定的相对位置,需要先从票据图像中区分不同的票据的图像。
[0076]
需要说明的是,对于目标检测模型而言,可以快速从票据图像中检测出多个票据候选区域和多个标识候选区域,在此基础上,只需要确定每个票据候选区域关联的标识候选区域,即可区分出不同的目标票据。
[0077]
需要说明的是,交并比(intersection-over-union,iou)是目标检测中经常使用的一个概念,是产生的候选框与原标记框的交叠率,即它们的交集与并集的比值,当候选框位于原标记框中,交并比的比值为1。在本实施例中,交并比的计算可以通过以下公式完成:其中,obj
票据
为票据候选区域,obj
参考
为标识候选区域,本实施例的参考标识是位于目标票据中,因此以标识候选区域为候选框,票据候选区域为原标记框,当一个标识候选区域与一个票据候选区域的交并比为1,则可以确定该标识候选区域位于票选候选区域中,二者归属于同一张目标票据。当然,也可以通过其他形式确定票据候选区域与标识候选区域的位置关系,例如标识候选区域的像素坐标均位于票据候选区域内,本领域技术人员有动机根据实际情况选取具体的方式,能够确定票据候选区域和标识候选区域归属于同一张目标票据即可。
[0078]
需要说明的是,当根据交并比从票据图像中确定出多张目标票据,可以针对每一张目标票据依次执行图1所示实施例的操作,从而从每一张目标票据中识别出票据信息,本实施例对重复执行的步骤不多作赘述。
[0079]
另外,在一实施例中,参考图4,在执行图3所示实施例的步骤s310之前,还包括但不限于有以下步骤:
[0080]
步骤s410,从票据图像中确定目标票据的票据类型;
[0081]
步骤s420,根据票据类型确定目标票据的参考标识。
[0082]
需要说明的是,由于不同的票据有不同的参考标识,例如常见的发票中不仅包括
印章,也在固定的位置设置有二维码,本领域技术人员有动机根据实际需求有不同的参考标识,能够预先确定参考标识的位置,使得目标检测模型能够在训练过程中从该位置学习出参考标识的形状即可。
[0083]
需要说明的是,为了目标检测模型能够从票据图像中检测出参考标识的标识区域,需要在训练样本中标注标识区域和参考标识,因此需要在训练之前确定不同票据类型所对应的参考标识,例如可以预先定义两种票据标注和参考标识标注,并且确定每个样本的票据类型,使得目标检测模型在训练过程中能够学习到不同票据类型所对应的参考标识,具体的标注过程在此不多作限定。
[0084]
需要说明的是,为了根据目标票据的票据类型确定参考标识,可以在输入票据图像的同时输入票据类型,使得目标检测模型能够直接根据输入信息确定票据类型,当然,也可以通过目标检测模型对票据图像进行简答的图像识别,根据票据的排版方式或者关键字确定票据类型,根据实际需求选取具体方式即可,在此不多作限定。
[0085]
另外,在一实施例中,参考图4,图1所示实施例的步骤s130,通过以下公式得到:
[0086][0087]
其中,angle
reflect
为偏移角度,center(x,y)
ref
为标识中心坐标,center(x,y)
tar
为票据中心坐标。
[0088]
需要说明的是,在按确定标识中心坐标和票据中心坐标后,根据两点可以得到一条线段,基于此,可以结合平行或者垂直于票据图像的作一个直角三角形,从而根据上述所示的三角函数计算出偏移角度,具体计算过程为本领域技术人员熟知的技术,在此不多作赘述。
[0089]
另外,在一实施例中,参考图5,图1所示实施例的步骤s140还包括但不限于有以下步骤:
[0090]
步骤s510,确定偏移角度和基准角度之间的目标角度差,根据目标角度差确定目标旋转角度和目标旋转方向;
[0091]
步骤s520,将目标旋转角度和目标旋转方向确定为目标调整信息。
[0092]
需要说明的是,由于偏移角度表征目标票据在票据图像中的倾斜角度,并非直接用于调整的角度,由于票据识别需要将目标票据调整至基准位置,例如票据区域的边框与票据图像平行,因此在具备偏移角度的情况下,需要根据基准位置所对应的基准角度进行调整,例如上述实施例中以90作为基准角度,计算出偏移角度为95度时,目标角度差为5度,旋转方向为顺时针,基于此,以顺时针将票据图像旋转5度,则可以得到正方向的票据图像。
[0093]
需要说明的是,目标旋转方向可以是顺时针或者逆时针,具体方向可以根据实际需求选取,例如为了减少确定方向的流程,预先设定顺时针为目标旋转方向,又如,为了提高转动效率,以转动角度较小的方向作为目标旋转方向,本实施例对此不多作限定。
[0094]
另外,在一实施例中,基准角度的数量至少为二,参考图6,图5所示实施例的步骤s520还包括但不限于有以下步骤:
[0095]
步骤s610,根据偏移角度和多个基准角度确定多个候选角度差;
[0096]
步骤s620,将绝对值最小的候选角度差确定为目标角度差;
[0097]
步骤s630,当目标角度差为正数,确定目标旋转方向为顺时针,当目标角度差为负
数,确定目标旋转方向为逆时针。
[0098]
需要说明的是,由于票据图像可以转动,因此将目标票据调整至正方向,实质上需要将票据图像调整至与票据图像的边框以任意对应方式平行,例如,票据图像的上边框与票据图像的上边框、下边框、左边框或者右边框平行,实现任意一种方式的对齐之后,再调整票据图像即可实现目标票据的方向矫正,例如票据图像的上边框与票据图像的下边框平行且靠近下边框,此时目标票据在票据图像中颠倒,此时将票据图像转动180度即可实现目标票据位于正方向。
[0099]
需要说明的是,在上述基础上,可以预先设置多个基准角度,确定多个候选角度差,为了减少图像转动对图像清晰度的影响,本实施例选取绝对值最小的候选角度差为目标角度差,从而以最小的目标角度差进行转动,同时根据目标角度差的正负确定转动方向,例如目标角度差为5度,则代表顺时针转动5度,又如,目标角度差为-5度,则代表逆时针转动5度。
[0100]
为了更好地说明本实施例的技术方案,以下提出一个具体示例,在本示例中偏移角度为95度,基准角度的集合[-90,0,90,180],根据以下公式计算出候选角度差:|angle
reflect(1*1)

1*4-angles
reflect(1*4)
|,其中,angle
reflect(1*1)
为偏移角度,angles
reflect(1*4)
为基准角度组成的矩阵[-90,0,90,180],α
1*4
为一行四列的单位矩阵[1,1,1,1],得到的候选角度差的集合未结果为[185,95,5,-85],其中选取绝对值最小的候选角度差为5,因此目标角度差为5度,因此顺时针旋转5度即可实现目标票据的矫正。
[0101]
另外,在一实施例中,参考图7,目标检测模型的训练步骤包括但不限于:
[0102]
步骤s710,获取多张样本票据图像,样本票据图像预先标注有标注信息,标注信息包括标注票据区域和标注标识区域;
[0103]
步骤s720,将多张样本票据图像输入至目标检测模型,将目标检测模型训练至收敛。
[0104]
需要说明的是,样本票据图像的标注可以采用coco数据集的形式进行标注,在样本票据图像中标注参考标识和目标票据的区域,得到标注票据区域和标注标识区域,并分别标注每个区域的中心点、宽、高,使得目标检测模型能够根据标注信息进行训练,使得训练好的目标检测模型能够从输入图像中回归出票据区域和参考标识的区域以及中心点坐标,具体的训练过程为本领域技术人员熟知的技术,在此不多做赘述。
[0105]
需要说明的是,为了验证目标检测模型是否已经训练至收敛,可以将无批注的测试图像输入至目标检测模型,当目标检测模型的输出值与实际的票据区域和标识区域的数值相同或者差值满足预设阈值,则可以确定目标检测模型已经训练至收敛。
[0106]
另外,参照图8,本发明实施例提供了一种基于目标检测的票据识别装置,基于目标检测的票据识别装置800包括:
[0107]
图像获取单元810,用于获取待识别的票据图像,将票据图像输入预先训练好的目标检测模型;
[0108]
检测单元820,用于通过目标检测模型从票据图像中确定目标票据的票据区域,以及目标票据的参考标识的标识区域;
[0109]
定位单元830,用于确定票据区域的票据中心坐标和标识区域的标识中心坐标,根据票据中心坐标和标识中心坐标确定目标票据在票据图像中的偏移角度;
[0110]
图像调整单元840,用于根据偏移角度和预设的基准角度确定目标调整信息,根据目标调整信息调整票据图像,得到目标图像;
[0111]
识别单元850,用于对目标图像进行ocr识别处理,得到目标票据的票据信息。
[0112]
另外,参照图9,本发明的一个实施例还提供了一种电子设备,该电子设备900包括:存储器910、处理器920及存储在存储器910上并可在处理器920上运行的计算机程序。
[0113]
处理器920和存储器910可以通过总线或者其他方式连接。
[0114]
实现上述实施例的基于目标检测的票据识别方法所需的非暂态软件程序以及指令存储在存储器910中,当被处理器920执行时,执行上述实施例中的基于目标检测的票据识别方法,例如,执行以上描述的图1中的方法步骤s110至步骤s150、图3中的方法步骤s310至步骤s320、图4中的方法步骤s410至步骤s420、图5中的方法步骤s510至步骤s520、图6中的方法步骤s610至步骤s630、图7中的方法步骤s710至步骤s720。
[0115]
以上所描述的装置实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
[0116]
此外,本发明的一个实施例还提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被一个处理器或控制器执行,例如,被上述电子设备实施例中的一个处理器执行,可使得上述处理器执行上述实施例中的基于目标检测的票据识别方法,例如,执行以上描述的图1中的方法步骤s110至步骤s150、图3中的方法步骤s310至步骤s320、图4中的方法步骤s410至步骤s420、图5中的方法步骤s510至步骤s520、图6中的方法步骤s610至步骤s630、图7中的方法步骤s710至步骤s720。本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、装置可以被实施为软件、固件、硬件及其适当的组合。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读存储介质上,计算机可读存储介质可以包括计算机存储介质(或非暂时性存储介质)和通信存储介质(或暂时性存储介质)。如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除存储介质。计算机存储介质包括但不限于ram、rom、eeprom、闪存或其他存储器技术、cd-rom、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的存储介质。此外,本领域普通技术人员公知的是,通信存储介质通常包含计算机可读指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送存储介质。
[0117]
本实施例可用于众多通用或专用的计算机装置环境或配置中。例如:个人计算机、服务器计算机、手持电子设备或便携式电子设备、平板型电子设备、多处理器装置、基于微处理器的装置、置顶盒、可编程的消费电子设备、网络pc、小型计算机、大型计算机、包括以上任何装置或电子设备的分布式计算环境等等。本技术可以在由计算机执行的计算机程序的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申
请,在这些分布式计算环境中,由通过通信网络而被连接的远程处理电子设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储电子设备在内的本地和远程计算机存储介质中。
[0118]
附图中的流程图和框图,图示了按照本技术各种实施例的装置、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的各个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的程序。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的各个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的装置来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0119]
描述于本技术实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
[0120]
应当注意,尽管在上文详细描述中提及了用于动作执行的电子设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本技术的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
[0121]
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本技术实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是cd-rom,u盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算电子设备(可以是个人计算机、服务器、触控终端、或者网络电子设备等)执行根据本技术实施方式的方法。
[0122]
本实施例的电子设备可以包括:射频(radio frequency,rf)电路、存储器、输入单元、显示单元、传感器、音频电路、无线保真(wireless fidelity,wifi)模块、处理器、以及电源等部件。rf电路可用于收发信息或通话过程中,信号的接收和发送,特别地,将基站的下行信息接收后,给处理器处理;另外,将设计上行的数据发送给基站。通常,rf电路包括但不限于天线、至少一个放大器、收发信机、耦合器、低噪声放大器(low noise amplifier,lna)、双工器等。此外,rf电路还可以通过无线通信与网络和其他装置通信。上述无线通信可以使用任一通信标准或协议,包括但不限于全球移动通讯系统(global system of mobile communication,gsm)、通用分组无线服务(general packet radio service,gprs)、码分多址(code division multiple access,cdma)、宽带码分多址(wideband code division multiple access,wcdma)、长期演进(long term evolution,lte)、电子邮件、短消息服务(short messaging service,sms)等。存储器可用于存储软件程序以及模块,处理器通过运行存储在存储器的软件程序以及模块,从而执行电子设备的各种功能应用以及数据处理。存储器可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存
储根据电子设备的使用所创建的数据(比如音频数据、电话本等)等。此外,存储器可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。输入单元可用于接收输入的数字或字符信息,以及产生与电子设备的设置以及功能控制有关的键信号输入。具体地,输入单元可包括触控面板以及其他输入装置。触控面板,也称为触摸屏,可收集在其上或附近的触摸操作(比如使用手指、触笔等任何适合的物体或附件在触控面板上或在触控面板附近的操作),并根据预先设定的程式驱动相应的连接装置。可选的,触控面板可包括触摸检测装置和触摸控制器两个部分。其中,触摸检测装置检测触摸方位,并检测触摸操作带来的信号,将信号传送给触摸控制器;触摸控制器从触摸检测装置上接收触摸信息,并将它转换成触点坐标,再送给处理器,并能接收处理器发来的命令并加以执行。此外,可以采用电阻式、电容式、红外线以及表面声波等多种类别实现触控面板。除了触控面板,输入单元还可以包括其他输入装置。具体地,其他输入装置可以包括但不限于物理键盘、功能键(比如音量控制按键、开关按键等)、轨迹球、鼠标、操作杆等中的一种或多种。显示单元可用于显示输入的信息或提供的信息以及电子设备的各种菜单。显示单元可包括显示面板,可选的,可以采用液晶显示器(liquid crystal display,lcd)、有机发光二极管(organic light-emitting diode,oled)等形式来配置显示面板。进一步的,触控面板可覆盖显示面板,当触控面板检测到在其上或附近的触摸操作后,传送给处理器以确定触摸事件的类别,随后处理器根据触摸事件的类别在显示面板上提供相应的视觉输出。触控面板与显示面板是作为两个独立的部件来实现电子设备的输入和输入功能,但是在某些实施例中,可以将触控面板与显示面板集成而实现电子设备的输入和输出功能。电子设备还可包括至少一种传感器,比如光传感器、运动传感器以及其他传感器。具体地,光传感器可包括环境光传感器及接近传感器,其中,环境光传感器可根据环境光线的明暗来调节显示面板的亮度,接近传感器可在电子设备移动到耳边时,关闭显示面板和/或背光。作为运动传感器的一种,加速计传感器可检测各个方向上(一般为三轴)加速度的大小,静止时可检测出重力的大小及方向,可用于识别电子设备姿态的应用(比如横竖屏切换、相关游戏、磁力计姿态校准)、振动识别相关功能(比如计步器、敲击)等;至于电子设备还可配置的陀螺仪、气压计、湿度计、温度计、红外线传感器等其他传感器,在此不再赘述。音频电路、扬声器、传声器可提供音频接口。音频电路可将接收到的音频数据转换后的电信号,传输到扬声器,由扬声器转换为声音信号输出;另一方面,传声器将收集的声音信号转换为电信号,由音频电路接收后转换为音频数据,再将音频数据输出处理器处理后,经rf电路以发送给比如另一电子设备,或者将音频数据输出至存储器以便进一步处理。
[0123]
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本技术的其它实施方案。本技术旨在涵盖本技术的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本技术的一般性原理并包括本技术未公开的本技术领域中的公知常识或惯用技术手段。
[0124]
应当理解的是,本技术并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本技术的范围仅由所附的权利要求来限制。
[0125]
以上是对本发明的较佳实施进行了具体说明,但本发明并不局限于上述实施方式,熟悉本领域的技术人员在不违背本发明精神的前提下还可作出种种的等同变形或替
换,这些等同的变形或替换均包含在本发明权利要求所限定的范围内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献