图像分类方法、装置、电子设备、介质及产品与流程
- 国知局
- 2024-11-19 09:46:08
本公开涉及图像处理领域,尤其涉及一种图像分类方法、装置、电子设备、介质及产品。
背景技术:
1、近些年来,得益于深层的卷积神经网络以及庞大的训练数据,图像分类的研究取得了重大进展,模型在大型数据集(如imagenet)上的表现已经超越了人类,研究者们也开始关注更难的图像分类场景,如增量学习。一般模型的训练是事先将所有的数据准备好,数据是固定、静态的,而现实生活中互联网上的各行各业都会产生大量的新数据,显然这种只依靠静态数据训练模型的方式不再适用,因此需要一种可以让模型不停的学习到新的知识,并且尽量不忘记先前所学习到的旧知识的方法,从而在动态数据的情况下,提高图像分类的准确度。
技术实现思路
1、本公开提供一种图像分类方法、装置、电子设备、介质及产品,以解决相关技术中的问题,通过利用同类型下相同和不同数量的样本进行模型训练,提高模型在新旧训练数据不平衡时的学习效果,通过数据集结合方式对模型训练,降低模型在学习新内容时对旧知识的遗忘率,从而提高训练后图像分类模型的模型性能,提高了在对动态数据集进行图像分类时的准确度。
2、本公开的第一方面实施例提出了一种图像分类方法,该方法包括:获取第一训练集和第二训练集,第一训练集和第二训练集中的图像样本具有类型标签,第一训练集中每个类型的图像样本数量相同;利用第一训练集对待训练模型进行图像分类训练,以获取第一训练模型;基于第一训练集中图像样本的类型标签,从第二训练集中确定第三训练集,第三训练集中图像样本的类型与第一训练集中图像样本的类型不同,第三训练集中每个类型的样本数量与第一训练集中每个类型的图像样本数量相同;基于第一训练集、第二训练集和第三训练集,对第一训练模型进行迭代,以获取图像分类模型;利用图像分类模型,对待分类图像进行分类。
3、在本公开的一些实施例中,基于第一训练集、第二训练集和第三训练集,对第一训练模型进行迭代,以获取图像分类模型包括:将第三训练集中的图像样本从第二训练集中剔除,以获取第四训练集;对第一训练集和第三训练集进行合并,以获取第一融合训练集;对第一训练集和第四训练集进行合并,以获取第二融合训练集;对第一融合训练集和第二融合训练集进行采样,以获取采样训练集;基于第一融合训练集、第二融合训练集和采样训练集,对第一训练模型进行迭代,以获取图像分类模型。
4、在本公开的一些实施例中,基于第一融合训练集、第二融合训练集和采样训练集,对第一训练模型进行迭代,以获取图像分类模型包括:基于采样训练集,利用第一训练模型,确定交叉熵损失参数;基于采样训练集,利用待训练模型和第一训练模型,确定蒸馏损失参数;基于交叉熵损失参数和蒸馏损失参数,确定融合损失参数;利用融合损失参数,对第一训练模型迭代,以获取图像分类模型。
5、在本公开的一些实施例中,基于采样训练集,利用第一训练模型,确定交叉熵损失参数包括:利用第一训练模型,对采样训练集中属于第一融合训练集的图像样本进行分类评分,以获取第一分类评分;利用第一训练模型,对采样训练集中属于第二融合训练集的图像样本进行分类评分,以获取第二分类评分;基于第一采样训练集、第一分类评分和第二分类评分,确定交叉熵损失参数。
6、在本公开的一些实施例中,基于采样训练集,利用待训练模型和第一训练模型,确定蒸馏损失参数包括:利用待训练模型,对采样训练集中的图像样本进行分类评分,以获取第三分类评分;利用第一训练模型,对采样训练集中的图像样本进行分类评分,以获取第四分类评分;基于第三分类评分和第四分类评分,确定蒸馏损失参数。
7、在本公开的一些实施例中,利用融合损失参数,对第一训练模型迭代,以获取图像分类模型包括:按预设步长对第一训练模型进行迭代;将融合损失参数足预设要求时对应的模型,确定为图像分类模型。
8、本公开的第二方面实施例提出了一种图像分类装置,该装置包括:获取单元,用于获取第一训练集和第二训练集,第一训练集和第二训练集中的图像样本具有类型标签,第一训练集中每个类型的图像样本数量相同;第一训练单元,用于利用第一训练集对待训练模型进行图像分类训练,以获取第一训练模型;确定单元,用于基于第一训练集中图像样本的类型标签,从第二训练集中确定第三训练集,第三训练集中图像样本的类型与第一训练集中图像样本的类型不同,第三训练集中每个类型的样本数量与第一训练集中每个类型的图像样本数量相同;第二训练单元,用于基于第一训练集、第二训练集和第三训练集,对第一训练模型进行迭代,以获取图像分类模型;分类单元,用于利用图像分类模型,对待分类图像进行分类。
9、本公开的第三方面实施例提出了一种电子设备,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,其中,处理器用于运行计算机程序时,执行本公开第一方面实施例中描述的方法。
10、本公开的第四方面实施例提出了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,计算机指令用于使计算机执行本公开第一方面实施例中描述的方法。
11、本公开的第五方面实施例提出了一种计算机程序产品,包括计算机程序,计算机程序在被处理器执行时实现本公开第一方面实施例中描述的方法。
12、综上,根据本公开提出的图像分类方法,包括:获取第一训练集和第二训练集,第一训练集和第二训练集中的图像样本具有类型标签,第一训练集中每个类型的图像样本数量相同;利用第一训练集对待训练模型进行图像分类训练,以获取第一训练模型;基于第一训练集中图像样本的类型标签,从第二训练集中确定第三训练集,第三训练集中图像样本的类型与第一训练集中图像样本的类型不同,第三训练集中每个类型的样本数量与第一训练集中每个类型的图像样本数量相同;基于第一训练集、第二训练集和第三训练集,对第一训练模型进行迭代,以获取图像分类模型;利用图像分类模型,对待分类图像进行分类。本方法利用同类型下相同和不同数量的样本进行模型训练,提高模型在新旧训练数据不平衡时的学习效果,通过数据集结合方式对模型训练,降低模型在学习新内容时对旧知识的遗忘率,从而提高训练后图像分类模型的模型性能,提高了在对动态数据集进行图像分类时的准确度。
技术特征:1.一种图像分类方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述基于所述第一训练集、所述第二训练集和所述第三训练集,对所述第一训练模型进行迭代,以获取图像分类模型包括:
3.根据权利要求2所述的方法,其特征在于,所述基于所述第一融合训练集、所述第二融合训练集和所述采样训练集,对所述第一训练模型进行迭代,以获取图像分类模型包括:
4.根据权利要求3所述的方法,其特征在于,所述基于所述采样训练集,利用所述第一训练模型,确定交叉熵损失参数包括:
5.根据权利要求3所述的方法,其特征在于,所述基于所述采样训练集,利用所述待训练模型和所述第一训练模型,确定蒸馏损失参数包括:
6.根据权利要求3所述的方法,其特征在于,所述利用所述融合损失参数,对所述第一训练模型迭代,以获取图像分类模型包括:
7.一种图像分类装置,其特征在于,所述装置包括:
8.一种电子设备,其特征在于,包括:处理器和用于存储能够在处理器上运行的计算机程序的存储器,
9.一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,所述计算机指令用于使所述计算机执行根据权利要求1-6中任一项所述的方法。
10.一种计算机程序产品,其特征在于,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的方法。
技术总结本公开提供一种图像分类方法、装置、电子设备、介质及产品,该方法包括:获取第一训练集和第二训练集;利用第一训练集对待训练模型进行图像分类训练,以获取第一训练模型;基于第一训练集中图像样本的类型标签,从第二训练集中确定第三训练集;基于第一训练集、第二训练集和第三训练集,对第一训练模型进行迭代,以获取图像分类模型;利用图像分类模型,对待分类图像进行分类。本方法利用同类型下相同和不同数量的样本进行模型训练,提高模型在新旧训练数据不平衡时的学习效果,通过数据集结合方式对模型训练,降低模型在学习新内容时对旧知识的遗忘率,从而提高训练后图像分类模型的模型性能,提高了在对动态数据集进行图像分类时的准确度。技术研发人员:赵凯受保护的技术使用者:中移(苏州)软件技术有限公司技术研发日:技术公布日:2024/11/14本文地址:https://www.jishuxx.com/zhuanli/20241118/330142.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表