技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于原型补全与动态损失调整的小样本学习方法和系统  >  正文

一种基于原型补全与动态损失调整的小样本学习方法和系统

  • 国知局
  • 2024-10-15 10:12:26

本发明涉及小样本学习领域,尤其涉及一种基于原型补全与动态损失调整的小样本学习方法和系统。

背景技术:

1、深度学习的独特之处在于其能够从大量数据中自主学习特征,而非依赖人工设计,这种高质量的特征学习极大提升了识别系统的性能。然而,在医疗、军事和金融等领域的实际应用中,受限于隐私、安全或数据标注成本等因素,难以获得充足的标注训练样本。这种数据的稀缺性限制了深度学习在图像分类领域的进一步拓展。为此,小样本学习技术应运而生,旨在从少量样本中提炼出新的概念理解,依靠丰富的基础类别数据来识别有限标签样本下的新类别。

2、解决小样本学习问题的一种方法是构建一个特征空间,在这个空间中,不同类别的样本特征可以实现类内集中和类间发散。这个特征空间通常通过深度神经网络来表示,利用测试样本与训练样本之间的相似性,通过传递训练样本的标签信息来推断测试样本的类别。原型网络通过直接比较新样本与每个类别的原型,而不是计算新样本与支持集样本之间的相似性来进行分类,其中每个类别的原型是该类别在嵌入空间中的单个向量表示。此外,基于数据增强的小样本图像分类策略通过创造新的辅助数据扩展原始数据集,从而增加训练样本的数量。

3、原型网络性能高度依赖于特征空间的质量,当面对复杂或不均匀分布的数据时,模型可能难以捕捉到足够的类别差异,导致分类准确性下降。此外,它在处理新类别时可能需要更多的样本来形成准确的原型。

技术实现思路

1、为了至少能够部分地解决在小样本学习领域因数据稀缺而难以分类的问题,本发明提供一种基于原型补全与动态损失调整的小样本学习方法和系统,通过原型补全和损失函数动态调整两大策略,有效提升了小样本分类任务的性能。通过原型补全技术,增强了支持集的表示能力,可以更敏感地识别细微的类别差异。其次,引入损失函数动态调整机制增加了针对不同小样本场景的适应性和精确度。最后,通过对比实验和消融实验进一步证明了原型补全与损失函数动态调整机制在提高性能中的关键作用。

2、为了实现上述目的,本发明的技术方案是:

3、本发明第一方面提出了一种基于原型补全与动态损失调整的小样本学习方法,包括以下步骤:

4、步骤一:整合原始支持集和原始查询集的信息,通过标签传播生成新原型,并将新原型加入到原始支持集中,形成新的支持集,用于丰富支持集,同时增加了分类任务的灵活性和准确率;

5、步骤二:使用特征图重建网络根据新支持集得到重建查询集,便于保留空间细节,且提高了泛化能力和分类精确度;

6、步骤三:基于构建的动态损失函数计算原始查询集和重建查询集的损失,通过最小化所述损失来训练所述特征重建网络,动态损失函数确保了不会对多数类样本过于自信,并更加关注少数类和难以分类的样本,提高了整体的鲁棒性和性能;

7、步骤四:将待分类图像数据集输入至训练好的特征重建网络,得到图像分类结果。

8、进一步地,所述步骤一具体包括:

9、计算原始支持集和原始查询集之间的平均特征偏移,根据平均特征偏移校正原始查询集特征,便于校正后查询集特征更接近支持集的特征分布;

10、计算原始支持集特征和校正后查询集特征分别与原型之间的相似度,并将二者的相似度均转换为概率分布,便于根据概率分布计算重加权后的支持集和查询集的概率分布;

11、对原始支持集和校正后查询集的概率分布进行重加权,得到重加权后的支持集和查询集的概率分布,便于更新原型;

12、将重加权后的支持集和查询集的概率分布应用于各自的特征,以更新原型,将更新后的原型作为新的样本加入到支持集中,得到新支持集,便于提高分类任务的灵活性和准确率。

13、进一步地,按照以下公式计算校正后查询集特征:

14、

15、

16、fq′=fq+δ

17、其中,qi为第i个查询样本的特征矩阵,si为第i个支持样本的特征矩阵,nsupport为原始支持集类别的数量,nquery为原始查询集类别的数量,和分别是原始支持集特征和原始查询集特征的平均值,fq′是校正后查询集特征,fq为原始查询集特征,δ为原始支持集特征和原始查询集特征的平均值的差值;

18、按照以下公式计算原始支持集和校正后查询集的概率分布:

19、ps=exp(cos(fs,p))

20、pq=exp(cos(fq′,p))

21、其中,ps和pq分别是原始支持集和校正后查询集与原型的概率分布,cos为余弦相似度函数,exp为指数函数;

22、按照以下公式计算重加权后的支持集和查询集的概率分布:

23、

24、其中,n是归一化向量,ns和nq分别是原始支持集和校正后查询集的样本数量,lsi和lqi分别是原始支持集和校正后查询集中第i个样本的标签,j为于类别数,psi和pqi分别是原始支持集和校正后查询集与原型的概率分布,one_hot为独热编码,wq为重加权后的查询集的概率分布,ws为重加权后的支持集的概率分布;

25、按照以下公式计算新支持集:

26、

27、s′=s+p

28、其中,p为更新后的原型,s为原始支持集,s′为新支持集。

29、进一步地,所述步骤三中,动态损失函数构建过程具体包括:

30、根据独热编码初始化一个权重调整矩阵,并将特征重建网络输出的结果经过softmax处理得到概率矩阵;

31、根据概率矩阵计算每个样本对真实标签的预测概率,并遍历所有样本以更新权重调整矩阵,如果样本的真实标签的预测概率低于设定的阈值,增加该样本真实标签对应类别的权重,减少其他类别的权重,以得到样本的新权重,通过动态权重提高了整体的泛化性能;

32、计算每个样本的损失,并利用权重调整矩阵对所有样本的加权损失进行汇总,从而得到总损失,便于对那些预测不准确或困难样本给予更多的关注。

33、进一步地,按照以下公式表示真实标签概率:

34、

35、pti=pi,j

36、其中,c是类别的总数,xi,j是第i个样本在第j个类别上的特征重建网络输出,pi,j为第i个样本在第j个类别上的样本概率矩阵,pti为第i个样本的真实标签的预测概率;

37、按照以下公式表示样本的权重:

38、

39、其中,wi为第i个样本对应的权重,c是类别的总数,eps是一个很小的常数;

40、按照以下公式表示每个样本的损失:

41、

42、其中,γ为控制正负样本权重参数,li为第i个样本的损失,c是类别的总数,pti为第i个样本的真实标签的预测概率,pi,j为第i个样本在第j个类别上的样本概率矩阵。

43、本发明第二方面提出了一种基于原型补全与动态损失调整的小样本学习系统,包括:

44、新原型生成模块,用于整合原始支持集和原始查询集的信息,通过标签传播生成新原型,并将新原型加入到原始支持集中,形成新的支持集,用于丰富支持集,同时增加了分类任务的灵活性和准确率;

45、特征图重建模块,用于使用特征图重建网络根据新支持集得到重建查询集,便于保留空间细节,且提高了泛化能力和分类精确度;

46、训练模块,用于基于构建的动态损失函数计算原始查询集和重建查询集的损失,通过最小化所述损失来训练所述特征重建网络,动态损失函数确保了不会对多数类样本过于自信,并更加关注少数类和难以分类的样本,提高了整体的鲁棒性和性能;

47、分类模块,用于将待分类图像数据集输入至训练好的特征重建网络,得到图像分类结果。

48、本发明第三方面提出了一种终端设备,包括处理器、存储器以及存储在所述存储器中且被配置为由所述处理器执行的计算机程序,所述处理器执行所述计算机程序时实现如上述第一方面所述的一种基于原型补全与动态损失调整的小样本学习方法。

49、本发明第四方面提出了一种计算机可读存储介质,所述存储介质包括存储的计算机程序,其中,在所述计算机程序运行时控制所述存储介质所在设备执行如上述第一方面所述的一种基于原型补全与动态损失调整的小样本学习方法。

50、本发明的有益效果:

51、(1)本发明使用支持样本和查询样本之间的近邻样本,扩充计算原型的支持样本,根据相似度进行加权求和更新原型将新原型当作一个支持样本进行数据增强,同时应用损失函数的动态调整策略使特征重建网络关注到那些难分类的样本上,以显著提高小样本分类任务的准确性。通过细致降低类内偏差与跨类偏差,实现了原型的精确重建与调整,使得在多个标准小样本学习数据集上的表现达到了领先水平。

52、(2)本发明通过引入了原型补全机制,细捕捉类内的关键特征,有效地生成了更具代表性和准确性的类原型,增强了对支持集数据的理解和表征能力。

53、(3)本发明利用原型补全后的特征在特征图重建模块中进行数据增强,有效结合了原型补全和特征重建的技术,丰富了训练数据集,并通过优化特征表达显著提升了对未知类别的适应性和泛化能力。

54、(4)本发明采用了动态损失函数调整策略,能够更加关注难以分类的样本,确保了一种基于原型补全与动态损失调整的小样本学习系统在学习过程中能够自适应地调整,针对不同难度的样本实现个性化的损失权重调整,从而在提高分类准确性的同时保持了一种基于原型补全与动态损失调整的小样本学习系统的鲁棒性。

本文地址:https://www.jishuxx.com/zhuanli/20241015/316783.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。