一种图像目标识别方法
- 国知局
- 2024-07-31 23:03:17
本发明涉及计算机视觉,尤其涉及一种图像目标识别方法。
背景技术:
1、人工智能技术的高速发展,深度学习越来越多的应用于计算机视觉中,尤其是图像的目标识别领域。
2、虽然现有的目标识别模型能够实现图像中目标的识别,但是,现有的目标识别模型存在着“灾难性遗忘”重大缺陷。其中,所谓的灾难性遗忘是指在学习了新的知识之后,几乎彻底遗忘掉之前习得的内容,它使得人工智能模型缺乏像生物一样不断适应环境以及持续(增量式)学习的能力。此外,虽然可将新数据加入到历史训练数据集中,用包含新旧训练数据的数据集对模型进行重新训练,但这样做法的学习效率太低。
技术实现思路
1、(一)要解决的技术问题
2、鉴于现有技术的上述缺点、不足,本发明提供一种图像目标识别方法,其现有技术中存在着的“灾难性遗忘”的技术问题。
3、(二)技术方案
4、为了达到上述目的,本发明采用的主要技术方案包括:
5、第一方面,本发明实施例提供一种图像目标识别方法,包括:获取待识别图像;将待识别图像输入到预先训练好的能够持续学习的图像目标识别模型中,图像目标识别模型对待识别图像中的目标进行识别,输出图像目标识别结果;
6、其中,图像目标识别模型包括多个并列设置且能够新增目标感知模块的多分支感知模块、与多个并列设置的多分支感知模块连接的第一图像相似度计算模块和与第一图像相似度计算模块连接的输出模块,且多个多分支感知模块中每个多分支感知模块均包括多个同类型的目标感知模块,且每个多分支感知模块对应的多个目标感知模块均通过正反馈循环的方式对待识别图像中的目标进行感知,以及每个多分支感知模块中新增的同类型的目标感知模块是利用对应的多分支感知模块中其他的目标感知模块均判别错误的训练样本进行训练后得到的;每个多分支感知模块均用于对待识别图像进行感知,以得到每个多分支感知模块的输出图像和与每个输出图像对应的正反馈循环的迭代次数,第一图像相似度计算模块用于计算待识别图像和每个输出图像的图像相似度,得到多个图像相似度,输出模块用于基于迭代次数和多个图像相似度进行目标识别,得到图像目标识别结果。
7、因此,借助于上述技术方案,本技术保证了图像目标识别模型的持续学习能力,进而能够解决现有技术中存在着的“灾难性遗忘”问题。
8、在一些可能的实施例中,输出模块进一步用于判断所有迭代次数中最小的迭代次数对应的图像相似度是否为所有图像相似度中最大的图像相似度,若确定最小的迭代次数对应的图像相似度为最大的图像相似度,则将最小的迭代次数对应的输出图像的类别作为图像目标识别结果。
9、在一些可能的实施例中,每个多分支感知模块均设置有用于表示对应的多分支感知模块在与所有多分支感知模块进行竞争时的优胜能力的第一竞争指标;
10、输出模块进一步用于若确定最小的迭代次数对应的图像相似度并非为最大的图像相似度,则确定最小的迭代次数对应的第一竞争指标是否为所有第一竞争指标中最大的第一竞争指标,若最小的迭代次数对应的第一竞争指标为最大的第一竞争指标,则将最小的迭代次数对应的输出图像的类别作为图像目标识别结果。
11、在一些可能的实施例中,第一竞争指标的确定过程包括:在图像目标识别模型的本次训练过程中,获取本次训练过程中每个多分支感知模块对应的第一训练图像相似度;按照从大到小的顺序对所有第一训练图像相似度进行排序,以确定最大的第一训练图像相似度;将最大的第一训练图像相似度对应的第一竞争指标的值加1。
12、在一些可能的实施例中,每个多分支感知模块的每个目标感知模块均设置有用于表示对应的目标感知模块在与对应的多分支感知模块的所有目标感知模块进行竞争时的优胜能力的第二竞争指标;
13、输出模块进一步用于若最小的迭代次数对应的第一竞争指标并非为最大的第一竞争指标,则确定最小的迭代次数对应的多分支感知模块的所有第二竞争指标中最大的第二竞争指标,并判断最大的第二竞争指标是否唯一,若确定最大的第二竞争指标唯一,则将最大的第二竞争指标对应的目标感知模块的输出图像的类别作为图像目标识别结果。
14、在一些可能的实施例中,第二竞争指标的确定过程包括:在图像目标识别模型的本次训练过程中,获取当前多分支感知模块在本次迭代过程中的所有目标感知模块的输出图像和图像目标识别模型的输入图像的第二训练图像相似度;按照从大到小的顺序对当前多分支感知模块对应的所有第二训练图像相似度进行排序,以确定当前多分支感知模块对应的最大的第二训练图像相似度;将当前多分支感知模块中与最大的第二训练图像相似度对应的目标感知模块的第二竞争指标的值加1。
15、在一些可能的实施例中,每个多分支感知模块的每个目标感知模块进一步均设置有用于表示其目标感知能力的感知指标;
16、输出模块进一步用于若确定最小的迭代次数对应的多分支感知模块的所有第二竞争指标中最大的第二竞争指标并非唯一,则确定最小的迭代次数对应的多分支感知模块的所有感知指标中最大的感知指标,并判断最大的感知指标是否唯一,若确定最大的感知指标唯一,则将最大的感知指标对应的目标感知模块的输出图像的类别作为图像目标识别结果。
17、在一些可能的实施例中,图像目标识别模型的训练样本包括当前正样本;感知指标的确定过程包括:在利用当前正样本对图像目标识别模型进行本次训练过程中,获取当前多分支感知模块在本次迭代过程中的所有目标感知模块的输出图像和图像目标识别模型的输入图像的第三训练图像相似度;将所有第三训练图像相似度中大于等于预设的第一图像相似度阈值的第三训练图像相似度对应的感知指标的值加1,并将所有第三训练图像相似度中小于第一图像相似度阈值且其对应的输出图像并非为全零像素图的第三训练图像相似度对应的感知指标的值减1,以及还令所有与其对应的输出图像为全零像素图的第三训练图像相似度对应的感知指标的值维持不变。
18、在一些可能的实施例中,图像目标识别模型的训练样本包括当前负样本;感知指标的确定过程包括:在利用当前负样本对图像目标识别模型进行本次训练过程中,获取当前多分支感知模块在本次迭代过程中的所有目标感知模块的输出图像,并判断每个输出图像是否为全零像素图;将所有其对应的输出图像为全零像素图的感知指标的值加1,并将所有其对应的输出图像并非为全零像素图的感知指标的值减1。
19、第二方面,本技术实施例提供了一种存储介质,该存储介质上存储有计算机程序,该计算机程序被处理器运行时执行第一方面或第一方面的任一可选的实现方式所述的方法。
20、第三方面,本技术实施例提供了一种电子设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当所述电子设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行第一方面或第一方面的任一可选的实现方式所述的方法。
21、第四方面,本技术提供一种计算机程序产品,所述计算机程序产品在计算机上运行时,使得计算机执行第一方面或第一方面的任意可能的实现方式中的方法。
22、为使本技术实施例所要实现的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
本文地址:https://www.jishuxx.com/zhuanli/20240730/195810.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。