一种发票查验方法、装置、发票查验服务设备及存储介质与流程
- 国知局
- 2024-07-31 21:55:35
本发明涉及发票校验,尤其涉及一种发票查验方法、装置、发票查验服务设备及存储介质。
背景技术:
1、为缓解纳税人的发票盖章需求,多地办税服务厅已增设代开增值税纸质发票自助盖章设备,纳税人可自行到该设备进行发票的盖章,不需要再到办事窗口咨询办税人员进行盖章,但是由于该设备目前只有盖章功能,并没有发票查验功能,日常使用过程中发现,经常出现纳税人已盖章的发票无法辨别真伪等问题,随着税收信息化的发展,税务机关对于纸质发票的查验和管理需求越来越高,现有技术已经存在自动进行发票查验的技术可以解决上述问题,然而在实际场景中,由于拍摄角度等原因,会使得发票图片中的文本出现倾斜,那么在进行发票查验之前会对发票图片进行一个图片矫正,以便后续准确地提取出发票图像中的文本信息。
2、但是现有技术在对发票图片进行矫正时,是将整一张发票图像沿同一个角度旋转,然而在实际场景中,即使是同一张发票,如果发票褶皱的话,褶皱处的文本的倾斜角度可能与会与其他文本的倾斜角度不同,进而出现同一发票,出现多个倾斜角度不同的这种文本字段,如果采用现有的方法将发票图像中的所有文本都沿同一个角度旋转的话,依旧会存在一些倾斜的文本字段,导致发票图像矫正效果不理想,进而使得发票校验的准确率降低。
技术实现思路
1、本发明实施例提供一种发票查验方法、装置、发票查验服务设备及存储介质,能够改善发票图像的矫正效果,提高发票真伪校验的准确性。
2、本发明一实施例提供了一种发票查验方法,包括如下步骤:
3、获取待查验发票的发票图像。
4、识别所述发票图像中各文本信息的位置,继而根据各文本信息的位置生成各文本信息所对应的包围格。
5、对于每一包围格,以包围格的长边为基准,生成包围格所对应的法向量。
6、根据各包围格的法向量对各包围格进行聚类,生成若干包围格集。
7、对于每一包围格集,计算包围格集的平均法向量,继而计算所述平均法向量与竖直方向的夹角,第一夹角。
8、在所述第一夹角大于预设夹角时,将包围格集中各包围格以及各包围格所对应的文本信息进行旋转,直至旋转后包围格集的平均法向量与竖直方向的夹角小于所述预设夹角,得到矫正后的发票图像
9、根据矫正后的发票图像,提取发票号码以及发票代码,继而根据所述发票号码以及发票代码确定待查验发票的真伪。
10、进一步地,所述获取待查验发票的发票图像,包括:获取用户输入的用户名和密码;对所述用户名和密码进行验证,在验证通过的情况下,接收用户所传入的发票图像,得到所述待查验发票的发票图像。
11、进一步地,所述根据各包围格的法向量对各包围格进行聚类,生成若干包围格集,包括:计算各包围格的法向量与竖直方向的夹角;根据各夹角的度数,对各包围格进行聚类,生成若干包围格集;其中,同一包围格集中各包围格所对应的夹角度数在同一预设范围内。
12、进一步地,在根据矫正后的发票图像,提取发票号码以及发票代码之前,还包括:对矫正后的发票图像中的文本方向进行识别;在确定文本方向倒立时,将矫正后的发票图像旋转180度。
13、进一步地,根据矫正后的发票图像,提取发票号码以及发票代码,包括:
14、提取矫正后的发票图像中各包围格中的文本信息;
15、从所述文本信息中提取出以发票号码标识开头的文本,以及以发票代码标识开头的文本,分别得到第一选定文本和若干第二选定文本;
16、去除所述第一选定文本中的发票号码标识,得到所述发票号码;
17、去除每一所述第二选定文本中的发票代码标识,得到若干待选定发票代码;
18、对所述待选定发票代码进行去重,继而将置信度分数最高的待选定发票代码,作为所述发票代码。
19、进一步地,根据所述发票号码以及发票代码确定待查验发票的真伪,包括:
20、根据所述发票号码以及发票代码,确定所述发票号码以及发票代码所对应的发票是否已经在税务系统开具成功;
21、若是,则确定所述待查验发票为真;
22、若否,则确定所述待查验发票为假。
23、在上述方法项实施例的基础上,本发明对应提供了装置项实施例;
24、本发明一实施例提供了一种发票查验装置,包括:数据获取模块、包围格生成模块、法向量生成模块、聚类模块、夹角确定模块、图像矫正模块以及真伪校验模块;
25、所述数据获取模块,用于获取待查验发票的发票图像;
26、所述包围格生成模块,用于识别所述发票图像中各文本信息的位置,继而根据各文本信息的位置生成各文本信息所对应的包围格;
27、所述法向量生成模块,用于对于每一包围格,以包围格的长边为基准,生成包围格所对应的法向量;
28、所述聚类模块,用于根据各包围格的法向量对各包围格进行聚类,生成若干包围格集;
29、所述夹角确定模块,用于对于每一包围格集,计算包围格集的平均法向量,继而计算所述平均法向量与竖直方向的夹角,第一夹角;
30、所述图像矫正模块,用于在所述第一夹角大于预设夹角时,将包围格集中各包围格以及各包围格所对应的文本信息进行旋转,直至旋转后包围格集的平均法向量与竖直方向的夹角小于所述预设夹角,得到矫正后的发票图像;
31、所述真伪校验模块,用于根据矫正后的发票图像,提取发票号码以及发票代码,继而根据所述发票号码以及发票代码确定待查验发票的真伪。
32、在上述方法项实施例的基础上,本发明另一实施例提供了一种发票查验服务设备,所述发票查验服务设备包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现本发明任意一项所述的发票查验方法;
33、在上述方法项实施例的基础上,本发明另一实施例提供了一种存储介质,所述存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述存储介质所在设备执行本发明任意一项所述的发票查验方法。
34、通过实施本发明实施例具有如下有益效果:
35、本发明实施例提供了一种发票查验方法、装置、发票查验服务设备及存储介质,所述方法首先识别所述发票图像中各文本信息的位置,继而根据各文本信息的位置生成各文本信息所对应的包围格;对于每一包围格,以包围格的长边为基准,生成包围格所对应的法向量;根据各包围格的法向量对各包围格进行聚类,生成若干包围格集;对于每一包围格集,计算包围格集的平均法向量,继而计算所述平均法向量与竖直方向的夹角,第一夹角;在所述第一夹角大于预设夹角时,将包围格集中各包围格以及各包围格所对应的文本信息进行旋转,直至旋转后包围格集的平均法向量与竖直方向的夹角小于所述预设夹角,得到矫正后的发票图像;根据矫正后的发票图像,提取发票号码以及发票代码,继而根据所述发票号码以及发票代码确定待查验发票的真伪。与现有技术相比,本发明可根据不同包围格集的平均法向量与竖直方向的夹角,对包围格集中各包围格所对应文本信息进行不同程度的旋转,使得同一张发票中不同倾斜角度的文本信息可以实现差异化旋转,从而改善了图像矫正的效果,使得后续在提取文本信息时更加的准确,进而提高了后续发票校验的准确性。
本文地址:https://www.jishuxx.com/zhuanli/20240731/191622.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表