技术新讯 > 计算推算,计数设备的制造及其应用技术 > 图像识别方法、装置、电子设备以及存储介质与流程  >  正文

图像识别方法、装置、电子设备以及存储介质与流程

  • 国知局
  • 2024-08-05 12:03:13

本技术涉及计算机视觉,尤其涉及一种图像识别方法、装置、电子设备以及存储介质。

背景技术:

1、图像识别需要先对待处理图像进行目标检测以检测到目标物体,再对目标物体进行图像识别,得到识别结果。目前,可以基于神经网络模型进行图像识别。

2、通常,待处理图像中需要进行识别的目标物体可以分为大目标物体和小目标物体。相关技术中,神经网络模型能够轻易实现对待处理图像中大目标物体的检测和识别。然而,由于小目标物体包含的信息相对有限,因此神经网络模型能够检测到的小目标物体特征十分模糊,模糊的小目标物体特征无法在识别过程中支撑神经网络模型做出高置信度的预测,故相关技术对待处理图像中对小目标物体的识别质量较差。

技术实现思路

1、本技术实施例的主要目的在于提出一种图像识别方法、装置、电子设备以及存储介质,旨在提高对待处理图像中小目标物体的识别质量。

2、为实现上述目的,本技术实施例的第一方面提出了一种图像识别方法,方法包括:

3、获取待处理图像,对待处理图像中的目标物体进行全局的特征提取,得到初始特征,并将初始特征输入至预先训练好的图像识别模型中;

4、对初始特征进行编码得到编码特征,并分别对初始特征和编码特征进行特征增强,基于特征增强后的初始特征和编码特征进行交叉融合处理,得到交叉融合特征;

5、对编码特征进行动态位置查询,得到动态查询特征,并获取与动态查询特征相对应的静态查询特征;

6、基于动态查询特征和静态查询特征对交叉融合特征进行解码,得到解码特征,并基于解码特征对待处理图像中的目标物体进行识别,得到目标识别结果。

7、在一些实施例中,分别对初始特征和编码特征进行特征增强,包括:

8、对初始特征进行第一全连接处理和第一归一化处理后的结果进行激活,并对激活后的结果进行特征提取,得到初始特征对应的第一提取特征;

9、基于第一提取特征和编码特征计算得到第一乘积,将初始特征与第一乘积进行加和,得到特征增强后的初始特征;

10、对编码特征进行第二全连接处理和第二归一化处理后的结果进行激活,并对激活后的结果进行特征提取,得到编码特征对应的第二提取特征;

11、基于第二提取特征和初始特征计算得到第二乘积,将编码特征与第二乘积进行加和,得到特征增强后的编码特征。

12、在一些实施例中,基于特征增强后的初始特征和编码特征进行交叉融合处理,得到交叉融合特征,包括:

13、拼接特征增强后的初始特征和编码特征,得到连接特征,从连接特征中提取得到第三提取特征;

14、以不同的融合比例将第三提取特征分别与初始特征、编码特征进行交叉融合处理,得到交叉融合特征。

15、在一些实施例中,以不同的融合比例将第三提取特征分别与初始特征、编码特征进行交叉融合处理,包括:

16、基于预设的第一权重值,计算编码特征和第三提取特征之间的第三乘积;

17、基于预设的第二权重值,计算初始特征和第三提取特征之间的第四乘积,其中,第一权重值大于第二权重值;

18、对第三乘积和第四乘积进行加和,得到交叉融合特征。

19、在一些实施例中,对编码特征进行动态位置查询,得到动态查询特征,包括:

20、对编码特征进行线性处理得到对应的多个线性处理结果,其中,线性处理结果包括对应的线性处理分数;

21、根据线性处理分数的大小顺序,对多个线性处理结果进行排序;

22、根据预设的目标数量,对排序后的多个线性处理结果进行筛选,得到动态查询特征。

23、在一些实施例中,图像识别模型是通过以下步骤训练得到的:

24、获取样本图像,对样本图像中的样本目标物体进行全局的特征提取,得到样本初始特征,并将样本初始特征输入至图像识别模型中;

25、对样本初始特征进行编码得到样本编码特征,并分别对样本初始特征和样本编码特征进行特征增强,基于特征增强后的样本初始特征和样本编码特征进行交叉融合处理,得到样本交叉融合特征;

26、对样本编码特征进行动态位置查询,得到样本动态查询特征,并获取与样本动态查询特征相对应的样本静态查询特征;

27、基于样本动态查询特征和样本静态查询特征对样本交叉融合特征进行解码,得到样本解码特征,并基于样本解码特征对样本图像中的样本目标物体进行识别,得到样本目标识别结果;

28、基于样本目标识别结果,确定样本损失值,根据样本损失值对图像识别模型的参数进行调整,得到训练后的图像识别模型。

29、在一些实施例中,在确定样本损失值之后,还包括:

30、联结图像识别模型和骨干模型,其中,骨干模型用于对样本图像中的样本目标物体进行全局的特征提取,得到样本初始特征;

31、基于样本损失值,对图像识别模型和骨干模型进行联合训练,得到训练后的图像识别模型和骨干模型。

32、在一些实施例中,在对样本图像中的样本目标物体进行全局的特征提取之前,还包括:

33、获取样本图像的第一边界框,并确定第一边界框对应的第一边界框高和第一边界框宽;

34、根据样本目标物体,确定第二边界框,并确定第二边界框对应的第二边界框高和第二边界框宽;

35、对限制在第二边界框内的样本目标物体进行分类处理,得到指示样本目标物体所属类别的真实类别信息;

36、计算第二边界框高和第一边界框高之间的第一比值,计算第二边界框宽和第一边界框宽之间的第二比值;

37、基于第一比值、第二比值和真实类别信息,确定样本目标物体的真实标签。

38、在一些实施例中,样本目标识别结果包括样本位置结果和样本类别结果,样本类别结果包括样本类别置信度;

39、基于样本目标识别结果,确定样本损失值,包括:

40、确定样本位置结果对应的第三边界框,并确定第三边界框对应的第三边界框高和第三边界框宽;

41、计算第三边界框高和第一边界框高之间的第三比值,计算第三边界框宽和第一边界框宽之间的第四比值;

42、基于第三比值、第四比值和样本类别结果,确定目标物体的预测标签;

43、对预测标签进行第一对数处理,得到第一对数结果,基于第一对数结果和真实标签计算得到第一子值;

44、对样本类别置信度进行第二对数处理,得到第二对数结果,基于第二对数结果和样本类别信息计算得到第二子值;

45、基于第一子值和第二子值,得到样本损失值。

46、为实现上述目的,本技术实施例的第二方面提出了一种图像识别装置,装置包括:

47、输入模块,用于获取待处理图像,对待处理图像中的目标物体进行全局的特征提取,得到初始特征,并将初始特征输入至预先训练好的图像识别模型中;

48、交叉融合处理模块,用于对初始特征进行编码得到编码特征,并分别对初始特征和编码特征进行特征增强,基于特征增强后的初始特征和编码特征进行交叉融合处理,得到交叉融合特征;

49、查询模块,用于对编码特征进行动态位置查询,得到动态查询特征,并获取与动态查询特征相对应的静态查询特征;

50、目标识别结果模块,用于基于动态查询特征和静态查询特征对交叉融合特征进行解码,得到解码特征,并基于解码特征对待处理图像中的目标物体进行识别,得到目标识别结果。

51、为实现上述目的,本技术实施例的第三方面提出了一种电子设备,电子设备包括存储器和处理器,存储器存储有计算机程序,处理器执行计算机程序时实现上述第一方面的图像识别方法。

52、为实现上述目的,本技术实施例的第四方面提出了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述第一方面的图像识别方法。

53、本技术提出的图像识别方法、装置、电子设备以及存储介质,其通过获取待处理图像,对待处理图像中的目标物体进行全局的特征提取,得到初始特征,并将初始特征输入至预先训练好的图像识别模型中;接着,对初始特征进行编码得到编码特征,并分别对初始特征和编码特征进行特征增强,基于特征增强后的初始特征和编码特征进行交叉融合处理,得到交叉融合特征,其中,交叉融合特征中包括了增强后的小目标物体特征,使得初始特征中原本模糊的小目标物体特征变得清晰,如此,为后续地图像识别提供了可靠的特征基础;对编码特征进行动态位置查询,得到动态查询特征,并获取与动态查询特征相对应的静态查询特征,其中,图像识别模型能够基于动态查询特征与静态查询特征,学习到模型预测的结果和真实结果之间的针对于边界框的偏置信息,进而使得最终得到的目标识别结果所表征的的位置和类别更接近真实情况,从而提高了待处理图像的图像识别质量,尤其是对小目标物体的识别质量;最后,基于动态查询特征和静态查询特征对交叉融合特征进行解码,得到解码特征,并基于解码特征对待处理图像中的目标物体进行识别,得到目标识别结果,由于交叉融合处理特征减轻了小目标物体特征的模糊性,在此基础上,还根据动态查询特征和静态查询特征对交叉融合特征进行有侧重性地特征提取,因此,经由编码器处理得到的编码特征所包含的小目标物体特征会更丰富、全面、清晰,也即其表示的对应小目标物体的特征也就更为准确,进而,基于该小目标物体特征进行的识别处理得到的目标识别结果的质量较高,提高了对小目标物体的检测精度。

本文地址:https://www.jishuxx.com/zhuanli/20240802/260827.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。