技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于路由选择与原型学习的主动增量学习方法  >  正文

一种基于路由选择与原型学习的主动增量学习方法

  • 国知局
  • 2024-10-09 15:48:52

本发明属于机器学习,具体涉及一种基于路由选择与原型学习的主动增量学习方法。

背景技术:

1、主动增量学习是主动学习和增量学习的结合领域。主动学习,又叫查询学习,是一种机器学习方法,旨在动态选择最有价值的样本来训练模型,以在有限的样本标注预算下提高学习效率。传统的机器学习方法通常需要大量标记好的样本数据来训练模型,然后将模型应用于未标记的数据进行预测。然而,标记样本的获取往往昂贵、耗时且需要大量人力。主动学习的目标是通过聪明地选择哪些未标记的样本应该被标注,以便在训练过程中更好地利用有限的标注资源。增量学习是指在连续的数据流中训练模型,同时保留和整合旧知识,解决灾难性遗忘的问题。它能够不断地处理现实世界中连续的信息流,在吸收新知识的同时保留甚至整合、优化旧知识。主动增量学习和现实世界人们的学习过程非常相似,它模仿了人类在面对未知领域时的学习方式。在人类学习中,倾向于专注于那些当前知识水平下最难或最不确定的任务,通过解决这些任务来获得最大的学习收益。在实际应用中,大量的流式数据并不是可以全部进行标注的,全部标注成本较高并且训练速度较慢。主动增量学习策略使模型能够识别出对其当前知识体系最具挑战性的样本,然后通过增量学习不断地从这些样本中学习,逐步提升模型的性能和适应性。这种学习方式不仅提高了学习效率,还使得模型能够更好地泛化到新的、未见过的数据上,正如人类能够将学到的知识应用到新情境中一样。主动增量学习是实现人工智能的重要基础研究之一,存在着巨大的实用和商业价值。

2、目前,主动增量学习方法只是基础性的将主动学习和增量学习的过程放在一起,使用随机采样,查询函数学习等常规的主动学习方法进行样本选择,不能在增量的过程中提高样本选择能力。并且由于主动增量学习只会使用主动学习选择出的样本的一部分进行增量模型训练,可以训练的样本数量较少很容易导致模型在新数据集的泛化能力降低,加深灾难性遗忘。

技术实现思路

1、为了克服现有技术的不足,本发明提供了一种基于路由选择与原型学习的主动增量学习方法,首先采用预训练视觉骨干模型对增量数据集输入图像提取一组特征向量,在此基础上将每一类图像的特征向量合并成一个特征矩阵,并且对这些特征向量取平均放在特征矩阵的第一行,将该特征输入预训练视觉骨干模型,得到一个处理后的特征矩阵,取特征矩阵的第一行特征向量作为该类别的类别原型,类别原型包含了该类别的共有特点,可以代表一个类别的总体特征。一个训练集的所有的类别原型则共同构成模型的分类器,从而使模型可以更清晰地区分不同图像类别。最后在增量数据集中通过基于路由选择的主动学习方法选择出一部分增量图像,将选出的图像作为增量模型的训练集进行训练来更新模型。本方法在多个数据集上的分类精确度均获得了突出进步。

2、本发明解决其技术问题所采用的技术方案如下:

3、步骤1:给定增量数据的所有输入图像,经由冻结参数的预训练视觉骨干模型编码得到每个图像的特征向量,其中,表示第i个类的第j张图片的特征向量,为实数集,表示特征数量,表示每个特征的通道数量;

4、步骤2:合并每个类别所有图像的特征向量得到每个类别的特征矩阵,其中表示第i个类别的图像数量;

5、步骤3:对每个类别个图像的特征向量取平均,,将合并到的第一列得到,将合并后的特征矩阵输入冻结参数的预训练视觉骨干模型编码得到,提取出特征之间的依赖关系,取的第一行特征向量进行归一化后作为第i类的类别原型,按照这个过程,求取训练数据所有类的类别原型;

6、步骤4:合并所有的类别原型得到类别原型矩阵,m为训练集样本种类的数量,即有m个类别原型;修改一个视觉骨干模型的分类器,将类别原型矩阵与模型倒数第二层输出的特征相乘得到预测概率矩阵,n为模型一次训练的样本数量,代表这n个样本属于m个类的预测概率,将修改后的视觉骨干模型作为增量模型;

7、步骤5:在一个视觉骨干模型编码器最后添加softmax层,使用softmax函数进行归一化操作,组成路由网络;将输入路由网络,得到第i类数据个样本的选择概率矩阵;按照概率大小,除了概率最高的前k个样本的概率,将中其余的样本的选择概率置为0;

8、步骤6:将每个样本的特征向量乘以中对应的权重得到加权后样本的特征向量,即,作为增量模型的新的训练集的一部分;对每个类都进行这个操作,得到增量模型新的训练集,选取出增量数据中最有价值的样本;

9、步骤7:将增量模型的训练集的样本输入步骤4中构建的增量模型中,得到最终分类分数,将采用交叉熵损失进行训练,即:,其中为温度参数;

10、步骤8:采用随机梯度下降sgd优化器对损失函数进行最小化,优化方法中的所有可训练参数;最终的分类结果为,argmax函数能够求自变量的最大值;

11、步骤9:每当有增量数据需要学习时重复步骤1至步骤8的内容,直至所有数据都学习完毕。

12、优选地,所述。

13、本发明的有益效果如下:

14、本发明方法利用预训练的视觉骨干模型对增量数据中的每个类别求出类别原型,将这些类别原型作为增量模型最后的分类器,提高了模型的泛化能力,同时在主动学习方面,构造出可学习的路由网络,实现了在增量模型的训练过程中更新路由网络的参数,提高样本选择能力。相对于以往方法,本方法在多个数据集上的分类精确度均获得了突出进步。

技术特征:

1.一种基于路由选择与原型学习的主动增量学习方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于路由选择与原型学习的主动增量学习方法,其特征在于,所述。

技术总结本发明公开了一种基于路由选择与原型学习的主动增量学习方法,首先采用预训练视觉骨干模型对增量数据集输入图像提取一组特征向量,在此基础上将每一类图像的特征向量合并成一个特征矩阵,将该特征输入预训练视觉骨干模型,得到一个特征矩阵,取特征矩阵的第一行特征向量作为该类别的类别原型,类别原型包含了该类别的共有特点,可以代表一个类别的总体特征。一个训练集的所有的类别原型则共同构成模型的分类器,从而使模型可以更清晰地区分不同图像类别。最后在增量数据集中通过基于路由选择的主动学习方法选择出一部分增量图像,将选出的图像作为增量模型的训练集进行训练来更新模型。本方法在多个数据集上的分类精确度均获得了突出进步。技术研发人员:王鹏,张艳宁,李俊杰,王庆圣受保护的技术使用者:西北工业大学技术研发日:技术公布日:2024/9/26

本文地址:https://www.jishuxx.com/zhuanli/20240929/310239.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。