一种清算收据数据识别系统及其方法与流程
- 国知局
- 2024-12-26 15:06:14
本发明属于收据数据识别,具体涉及一种清算收据数据识别系统及其方法。
背景技术:
1、随着智能数据处理技术的快速发展,收据自动识别逐渐成为企业高效处理财务和报销数据的重要工具。现阶段,基于光学字符识别(ocr)的收据识别系统已广泛应用于收据数据提取。然而,现有的ocr技术在实际应用中仍面临诸多局限,尤其是在处理复杂的收据图像时。首先,图像质量显著影响ocr识别的准确性。由于收据通常存在拍摄模糊、倾斜、光照不均匀等问题,ocr系统在识别时容易受到影响,导致识别错误率上升。例如,图像中的模糊字符或低分辨率会使ocr难以准确读取内容,而反光和阴影也会遮挡关键字段。其次,现有ocr技术的另一个关键缺陷在于缺乏语境理解能力。ocr主要用于逐字识别字符,缺少语义层次的分析,无法理解字段之间的逻辑关系。例如,对于收据中的日期、金额和商品名称等重要信息,ocr可能会识别出这些字符,但无法理解这些字段的含义和相互关系。这一缺陷使得系统容易出现数据错配,特别是在没有标准化标签或字段位置不固定的情况下,进一步影响了数据的结构化处理效果。
技术实现思路
1、本发明提供一种清算收据数据识别系统及其方法,解决相关技术中受图像质量和缺乏语境理解的限制,导致识别准确率不高,易出现数据错配和误识别的技术问题。
2、本发明提供了一种清算收据数据识别系统,包括图像获取与预处理模块、图像识别模块、字段识别与分类模块、字段关联分析模块、数据清洗与验证模块和数据输出模块:
3、图像获取与预处理模块,用于从多个角度拍摄目标收据的五张图像,使用图像配准技术进行对齐,具体如下:从目标收据的正面、左上、左下、右上和右下五个角度分别拍摄图像,通过尺度不变特征变换算法识别每张图像中的特征点,输出特征点的坐标和特征描述符,并使用欧氏距离计算特征点之间的相似度,进行特征点的匹配,同时通过计算距离比率排除误匹配,并使用仿射变换将五张图像的相似区域进行对齐;
4、其中,所述尺度不变特征变换算法的使用步骤包括:
5、步骤s201,基于五张不同角度的图像生成不同尺度的高斯差分图像;
6、步骤s202,通过极值检测从高斯差分图像中找到潜在特征点,并对潜在特征点进行过滤边缘响应和去除低对比度处理,得到特征点,并提取特征点的坐标;
7、步骤s203,通过计算特征点邻域的梯度方向直方图为每个特征点分配一个主方向;
8、步骤s204,将特征点邻域的梯度方向直方图进行拼接,得到特征点的特征描述符;
9、所述距离比率的计算公式为:,其中,表示距离比率,表示当前特征点描述符与最近的特征点的距离,表示当前特征点描述符与次近的特征点的距离;当距离比率大于第三阈值时,则该匹配为误匹配,需进行去除,第三阈值为自定义参数;
10、所述使用仿射变换将五张图像的相似区域进行对齐的步骤包括:
11、步骤s301,将拍摄角度为正面的图像作为基准图像,同时选择一张其他图像,在两张图像中找到k对匹配的特征点,根据仿射变换原理的坐标变换公式结合匹配的特征点构造仿射变换矩阵,该矩阵表达式为:,其中,t表示仿射变换矩阵,a、b、c和d分别表示第一系数、第二系数、第三系数和第四系数,用于控制图像的缩放、旋转和倾斜,tx和ty分别表示第一平移参数和第二平移参数,仿射变换原理的坐标变换公式为:,其中和分别为变换后的像素坐标的横坐标和纵坐标,x和y分别为变换前的像素坐标的横坐标和纵坐标,a、b、c、d、tx和ty通过匹配的特征点结合坐标变换公式构造线性方程组求解得到;
12、步骤s302,使用随机采样一致性算法过滤误匹配的特征点;
13、步骤s303,使用仿射变换矩阵,根据步骤s301中的坐标变换公式,通过基准图像的像素坐标计算并变换另一张图像的像素坐标;
14、步骤s304,重复步骤s301到步骤s303,将变换应用于除基准图像外的所有图像,使其与基准图像对齐;
15、应用融合算法将对齐后的图像进行融合,得到融合图像,对融合图像进行降噪和对比度增强处理,得到第一特征图像;
16、图像识别模块,用于使用图像识别技术从第一特征图像中提取收据数据;
17、字段识别与分类模块,用于识别收据数据中字段的内容及含义,并对字段进行分类,包括:使用光学字符识别技术从第一特征图像中提取所有的文本块,得到收据数据,其中,每个文本块包含一组连续的字符;
18、字段关联分析模块,用于使用依存句法分析算法识别收据数据中字段之间的逻辑关系,将收据数据中的字段进行匹配;
19、数据清洗与验证模块,用于对匹配后的收据数据进行清洗和内容验证;
20、数据输出模块,用于将清洗和验证处理后的收据数据进行结构化输出。
21、进一步地,使用融合算法将对齐后的图像进行融合,包括:
22、步骤s401,在每张图像的每个像素点周围定义一个n×n大小的邻域窗口,统计邻域窗口内各灰度级的频率分布,生成该邻域窗口的灰度直方图,其中,n为自定义参数,灰度级表示图像中像素的亮度;
23、步骤s402,根据灰度直方图计算所述像素点的熵值,并在五张图像中同一像素位置中选择熵值最高的像素,熵值的计算公式为:,其中,h表示像素点的熵值,表示灰度级i在该邻域窗口内出现的频率,j表示灰度级的数量;
24、步骤s403,将每个像素位置上具有最大熵值的像素填入最终融合图像的对应位置,生成完整的融合图像。
25、进一步地,对每个文本块中的字符进行识别,得到文本字符串,并使用自然语言处理技术对识别出的文本字符串进行语义解析,提取字段内容和含义,并根据预定义的规则库,将识别出的字段内容与规则进行匹配,确定字段的类别,其中,规则库中包含字段名称及字段名称的变体。
26、进一步地,使用基于转移的依存句法分析算法来分析收据数据中字段之间的逻辑关系,具体步骤包括:首先,将字段内容转换为适用于依存句法分析的输入格式,然后,通过应用left-arc转移操作构建依存关系树,形成字段之间的依存关系图,进而识别字段之间的逻辑关系,最后,根据依存关系图完成字段内容的匹配。
27、进一步地,对匹配后的收据数据进行清洗和内容验证,数据清洗包括:对字段内容进行格式化,去除空格和多余字符,以及拼写校正;内容验证包括:进行字段的格式验证、逻辑关系验证和一致性检查。
28、本发明提供一种清算收据数据识别方法,包括以下步骤:
29、步骤s601,从多个角度拍摄目标收据的五张图像,使用图像配准技术进行对齐,并应用融合算法将对齐后的图像进行融合,得到融合图像,并对融合图像进行降噪和对比度增强处理;
30、步骤s602,使用图像识别技术从第一特征图像中提取收据数据;
31、步骤s603,识别收据数据中字段的内容及含义,并对字段进行分类;
32、步骤s604,使用依存句法分析算法识别收据数据中字段之间的逻辑关系,将收据数据中的字段进行匹配;
33、步骤s605,对匹配后的收据数据进行清洗和内容验证;
34、步骤s606,将清洗和验证处理后的收据数据进行结构化输出。
35、本发明的有益效果在于:本发明通过从多个角度拍摄收据,并对图像进行配准和融合处理,有效减少了因光照不均、倾斜等问题导致的识别误差,提升了图像清晰度与对比度;
36、本发明利用特征点匹配算法和仿射变换对图像进行对齐,使多角度图像的关键信息一致,从而保证了图像融合的精度和数据的一致性;
37、本发明通过自然语言处理技术对识别出的文本进行分词和实体识别,并结合规则库匹配字段内容,能够准确区分并分类收据中的字段,有效提升了数据分类的准确性。
本文地址:https://www.jishuxx.com/zhuanli/20241226/344521.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表