技术新讯 > 计算推算,计数设备的制造及其应用技术 > 目标识别模型的训练、目标识别方法、系统、设备及介质与流程 > 正文

目标识别模型的训练、目标识别方法、系统、设备及介质与流程

国知局
2024-08-05 11:47:52

本技术涉及图像处理，尤其涉及一种目标识别模型的训练、目标识别方法、系统、设备及介质。

背景技术：

1、目标识别模型是一种利用计算机视觉和机器学习技术，通过分析和比较目标特征来进行识别的模型，可以应用于安全领域（如人脸门禁系统、人脸支付验证）、交通领域（车辆识别、交通标志识别）、医疗领域等。机器学习中的噪声数据问题是一个常见而关键的挑战。训练数据集中的噪声样本会改变训练数据的样本分布，对模型的训练和预测产生负面影响，进而导致模型的性能降低。为降低或消除噪声样本对模型的影响，通常采用人工标注的方式创建低噪声或无噪声或数据集合。

2、然而，训练数据集的数据规模在不断增大，通常包括几十万甚至更多的图像。对于这种大规模的数据集合，采用人工标注的方式会耗费大量的人力、物力资源。

技术实现思路

1、为解决上述技术问题或至少部分地解决上述技术问题，本技术实施例提供了一种目标识别模型的训练方法、目标识别方法、系统、电子设备及计算机可读存储介质。

2、第一方面，本技术实施例提供了一种目标识别模型的训练方法，包括：

3、根据原始样本的第一特征信息与镜像样本的第二特征信息之间的差异度，确定所述原始样本所属的状态；所述镜像样本为所述原始样本水平翻转后得到的样本；

4、为当前训练周期下不同状态的原始样本分配不同的权重；

5、根据所述原始样本在当前训练周期下的权重和预设的损失函数，确定损失值；

6、根据所述损失值对目标识别模型进行训练，得到训练后的目标识别模型。

7、可选地，所述原始样本所属的状态包括第一状态、第二状态和第三状态；

8、所述为当前训练周期下不同状态的原始样本分配不同的权重，包括：在当前训练周期下，为第一状态的原始样本分配的权重大于或等于为第二状态的原始样本分配的权重，为第二状态的原始样本分配的权重大于为第三状态的原始样本分配的权重。

9、可选地，所述为当前训练周期下不同状态的原始样本分配不同的权重，还包括：根据预设的衰减关系，为当前训练周期下第一状态的原始样本分配权重；所述预设的衰减关系指示第一状态的原始样本的权重从训练初始到训练结束的每个周期逐步减小；根据预设的增长关系，为当前训练周期下第二状态的原始样本分配权重；所述预设的增长关系指示第二状态的原始样本的权重从训练初始到训练结束的每个周期逐步增大。

10、可选地，所述预设的衰减关系指示从训练初始到训练结束第一状态的原始样本的权重由预设的第一初始值衰减到1，所述预设的增长关系指示从训练初始到训练结束第二状态的原始样本的权重由预设的第二初始值增大到1。

11、可选地，所述为当前训练周期下不同状态的原始样本分配不同的权重，还包括：确定在当前训练周期下第三状态的原始样本的权重为0。

12、可选地，所述目标识别模型包括特征提取网络，所述特征提取网络包括依次耦合的多个卷积层和第一全连接层；

13、所述方法还包括：将所述原始样本作为输入数据输入当前的目标识别模型，获取当前的特征提取网络的第一全连接层输出的第一向量，将所述第一向量作为所述原始样本在当前训练周期下的第一特征信息；将所述镜像样本作为输入数据输入当前的目标识别模型，获取当前的特征提取网络的第一全连接层输出的第二向量，将所述第二向量作为所述镜像样本在当前训练周期下的第二特征信息。

14、可选地，所述方法还包括：确定所述原始样本所属类别标签对应的类中心；确定所述第一特征信息与所述类别标签对应的类中心之间的第一距离；确定所述第二特征信息与所述类别标签对应的类中心之间的第二距离；根据所述第一距离和所述第二距离，确定当前训练周期下所述原始样本的第一特征信息与所述镜像样本的第二特征信息之间的差异度。

15、可选地，所述目标识别模型包括第二全连接层，所述第二全连接层用于根据所述第一特征信息对所述原始样本进行分类，以及根据所述第二特征信息对所述镜像样本进行分类；

16、所述确定当前训练周期下所述原始样本所属类别标签对应的类中心，包括：从当前的目标识别模型的第二全连接层的权重参数中，获取当前训练周期下所述原始样本所属类别标签对应的类中心。

17、可选地，所述根据所述第一距离和所述第二距离，确定当前训练周期下所述原始样本的第一特征信息与所述镜像样本的第二特征信息之间的差异度，包括：

18、根据当前训练周期和预设的最长历史周期数，确定所述当前训练周期对应的至少一个关联周期；

19、确定所述至少一个关联周期对应的第一距离、第二距离、系数，根据各所述关联周期对应的第一距离、第二距离、系数，确定当前训练周期下所述原始样本的第一特征信息与所述镜像样本的第二特征信息之间的差异度。

20、可选地，所述根据各所述关联周期对应的第一距离、第二距离、系数，确定当前训练周期下所述原始样本的第一特征信息与所述镜像样本的第二特征信息之间的差异度，包括：

21、针对各关联周期，确定所述关联周期对应的第一距离与第二距离之间的差值的绝对值；

22、根据各关联周期对应的系数，计算各关联周期对应的绝对值的加权和，将所述加权和作为当前训练周期下所述原始样本的第一特征信息与所述镜像样本的第二特征信息之间的差异度。

23、可选地，确定至少一个关联周期对应的系数，包括：确定当前训练周期对应的系数最大，确定距离当前训练周期越远的关联周期对应的系数越小。

24、可选地，所述根据原始样本的第一特征信息与镜像样本的第二特征信息之间的差异度，确定所述原始样本所属的状态，包括：

25、比较所述差异度、第一预设阈值和第二预设阈值，所述第一预设阈值小于所述第二预设阈值；

26、在所述差异度小于所述第一预设阈值的情况下，确定所述原始样本所属的状态为第一状态；

27、在所述差异度大于或等于所述第一预设阈值，且小于或等于所述第二预设阈值的情况下，确定所述原始样本所属的状态为第二状态；

28、在所述差异度大于所述第二预设阈值的情况下，确定所述原始样本所属的状态为第三状态。

29、可选地，所述根据所述原始样本的权重和预设的损失函数，确定损失值，包括：

30、将训练数据集进行划分，获得多个训练子集，所述训练数据集包括多个原始样本；

31、确定当前训练周期下，所述训练数据集中各类别标签对应的类中心；

32、针对训练子集中的原始样本，将所述原始样本所属类别标签对应的类中心作为第一类中心，将除原始样本所属类别标签之外的类别标签对应的类中心作为第二类中心，确定所述原始样本的第一特征信息与第一类中心之间的第一距离，以及所述原始样本的第一特征信息与第二类中心之间的第三距离；

33、根据预设的损失函数、所述训练子集中每个原始样本的权重、所属训练子集中每个原始样本对应的所述第一距离和所述第三距离，计算所述训练子集对应的损失值。

34、可选地，根据下式（1）为当前训练周期下不同状态的原始样本分配不同的权重：

35、（1）

36、其中，表示原始样本在第k个训练周期下的权重，e表示训练总周期数，为小于1的预设系数，为小于0.5的预设值。

37、可选地，根据下式（2）确定所述第一特征信息与所述类别标签对应的类中心之间的第一距离，根据下式（3）确定所述第二特征信息与所述类别标签对应的类中心之间的第二距离：

38、（2）

39、（3）

40、其中，表示第k个训练周期下的第一距离，表示第k个训练周期下的第二距离，表示原始样本，表示原始样本的镜像样本，表示原始样本在第k个训练周期下的第一特征信息，表示镜像样本在第k个训练周期下的第二特征信息，表示原始样本所属的类别标签，表示在第k个训练周期下类别标签对应的类中心，t表示向量转置，表示范数。

41、可选地，根据下式（4）确定所述当前训练周期对应的至少一个关联周期：

42、(4)

43、其中，k表示当前训练周期，h表示预设的最长历史周期数，max表示取（k-h+1）与0之间的较大值，z表示当前训练周期对应的关联周期，z为正整数。

44、可选地，根据下式（5）确定原始样本的第一特征信息与镜像样本的第二特征信息之间的差异度：

45、（5）

46、其中，表示在第k个训练周期下原始样本的第一特征信息与镜像样本的第二特征信息之间的差异度，表示预设的参考值。

47、可选地，根据下式（6）计算训练子集对应的损失值：

48、（6）

49、其中，l表示训练子集对应的损失值，b表示训练子集中原始样本的数量，表示训练子集中的第i个原始样本，表示原始样本在第k个训练周期的权重，e表示自然常数，s表示预设的缩放因子，m为预设的超参数， q表示训练数据集中除所述原始样本所属的类别标签之外的类别标签，表示原始样本的第一特征信息与类别标签q对应的类中心之间的第三距离，c表示训练数据集中类别标签的数量。

50、第二方面，本技术实施例提供了一种目标识别方法，包括：

51、将待识别图像作为输入数据输入目标识别模型，所述待识别图像包括待识别目标；所述目标识别模型根据本技术任一实施例所述的训练方法得到，所述目标识别模型包括特征提取网络；

52、获取所述特征提取网络输出的所述待识别图像的特征信息；

53、将所述待识别图像的特征信息与特征库中的已知特征进行匹配，确定所述待识别图像的特征信息与所述已知特征的相似度；

54、根据所述相似度，识别所述待识别图像上的待识别目标。

55、第三方面，本技术实施例提供了一种目标识别模型的训练系统，包括：

56、状态确定模块，根据原始样本的第一特征信息与镜像样本的第二特征信息之间的差异度，确定所述原始样本所属的状态；所述镜像样本为所述原始样本水平翻转后得到的样本；

57、权重确定模块，用于为当前训练周期下不同状态的原始样本分配不同的权重；

58、损失确定模块，用于根据所述原始样本在当前训练周期下的权重和预设的损失函数，确定损失值；

59、参数更新模块，用于根据所述损失值对目标识别模型进行训练，得到训练后的目标识别模型。

60、第四方面，本技术实施例提供了一种目标识别系统，包括：

61、输入模块，用于将至少一个待识别图像作为输入数据输入目标识别模型，所述至少一个待识别图像包括待识别目标；所述目标识别模型根据本技术任一实施例所述的训练方法得到；所述目标识别模型包括特征提取网络；

62、获取模块，用于获取所述特征提取网络输出的所述至少一个待识别图像的特征信息；

63、匹配模块，用于将所述至少一个待识别图像的特征信息与特征库中的已知特征进行匹配，确定所述至少一个待识别图像的特征信息与所述已知特征的相似度；

64、识别模块，用于根据所述相似度，识别所述待识别目标。

65、第五方面，本技术实施例提供了一种计算机程序产品，包括计算机程序，所述计算机程序被处理器执行时实现本技术任一实施例所述目标识别模型的的训练方法或目标识别方法。

66、第六方面，本技术实施例提供了一种电子设备，包括处理器、通信接口、存储器和通信总线，其中，处理器，通信接口，存储器通过通信总线完成相互间的通信；存储器，用于存放计算机程序；处理器，用于执行存储器上所存放的程序时，实现本技术任一实施例所述的目标识别模型的训练方法或目标识别方法。

67、第七方面，本技术实施例提供了一种计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现本技术任一实施例所述的目标识别模型的训练方法或目标识别方法。

68、本技术的实施例提供的技术方案至少带来以下有益效果：

69、本技术实施例提供的目标识别模型的训练方法，通过原始样本的第一特征信息与镜像样本的第二特征信息之间的差异度，确定原始样本所属的状态，然后为当前训练周期下不同状态的原始样本分配不同的权重，根据原始样本在当前训练周期下的权重和预设的损失函数，计算损失值，基于该损失值对目标识别模型进行训练，以更新目标识别模型的参数，并得到训练后的目标识别模型。该方法依据原始样本的第一特征信息与镜像样本的第二特征信息之间的差异度，对原始样本进行划分，将原始样本划分为不同的状态，进而为不同状态的样本分配不同的权重，实现通过权重控制不同状态的原始样本对目标识别模型的影响，从而能够降低或消除噪声样本对模型的干扰；进一步地，本技术实施例根据目标识别模型的训练周期，确定当前训练周期下各状态的原始样本的权重，使得各状态的原始样本的权重随着模型训练周期的变化而变化，进一步细化各状态的原始样本在不同的训练周期下对目标识别模型的影响，以提升模型的鲁棒性和准确性。