技术新讯 > 计算推算,计数设备的制造及其应用技术 > 虚假图像检测方法及相关装置与流程 > 正文

虚假图像检测方法及相关装置与流程

国知局
2024-10-09 15:37:12

本技术实施例涉及人工智能领域，更具体地涉及一种虚假图像检测方法及相关装置。

背景技术：

1、随着生成式人工智能技术的飞速发展，图像等多媒体内容编辑已经变得愈发便捷和高效。然而，如同双刃剑一般，生成式人工智能在极大地丰富了创意表达的可能性的同时，也催生了一系列不容忽视的风险与挑战，尤其是信息真实性与误导性问题日益凸显。该类技术可能会被恶意地用于生成虚假或误导性的图像，当前，主流的虚假图像检测方法主要依靠深度学习技术从大规模的标注数据中学习区分性特征来鉴别真假。首先，需要从互联网上收集并清洗真实图像，然后基于多种已知的图像伪造算法或软件制作大量逼真的虚假图像样本，最后基于构建的数据集训练深度学习分类模型来区分真假。然而，这类对于已知的伪造方法上展现出卓越的检测性能，但对于新型、未见过的伪造技术制作的数据时，其检测性能则显著下降。这是因为深度学习模型往往过度拟合于训练数据中的模式，一旦出现新的伪造方式，则缺乏足够的泛化性和适应性。因此，现有技术虚假图像检测的准确性较低。

技术实现思路

1、本技术实施例提供一种虚假图像检测方法及相关装置,可以提高虚假图像检测的准确性。

2、第一方面，本技术实施例提供一种虚假图像检测方法，该方法包括：

3、获取待检测图像；

4、基于目标特征编码模型对所述待检测图像进行特征提取，得到所述待检测图像的目标图像特征；

5、基于多层感知机分类模型和所述目标图像特征对所述待检测图像进行图像分类，得到第一图像分类结果；

6、基于支持向量机分类模型和所述目标图像特征对所述待检测图像进行图像分类，得到第二图像分类结果，其中，所述多层感知机分类模型基于第一图像训练集训练得到，所述支持向量机分类模型基于第二图像训练集训练得到，所述第二图像训练集为所述第一图像训练集的子集，所述第一图像训练集和所述第二图像训练集为不同的集合；

7、基于所述第一图像分类和所述第二图像分类结果确定所述待检测图像的目标图像分类结果。

8、在一个实施方式中，所述虚假图像检测方法，包括：

9、获取第一图像训练集，其中，所述第一图像训练集包括多个第一图像样本和对应的第一标注标签，所述第一标注标签为真实类别或者虚假类别；

10、基于所述第一图像训练集训练初始特征编码模型和第一初始分类模型，得到所述目标特征编码模型和所述多层感知机分类模型；

11、从所述第一图像训练集中筛选出第二图像训练集；

12、冻结所述目标特征编码模型，并基于所述第二图像训练集训练第二初始分类模型，得到所述支持向量机分类模型。

13、在一个实施方式中，所述基于所述第一图像训练集训练初始特征编码模型和第一初始分类模型，得到所述目标特征编码模型和所述多层感知机分类模型，包括：

14、将所述第一图像训练集中的多个第一图像样本输入所述初始特征编码模型，得到各个所述第一图像样本对应的样本特征；

15、将各个所述第一图像样本对应的样本特征输入所述第一初始分类模型，得到模型分类结果；

16、基于各个所述第一图像样本的第一标注标签和所述模型分类结果计算分类损失；

17、基于各个所述第一图像样本对应的样本特征和所述第一图像训练集计算对比损失；

18、基于所述分类损失和所述对比损失确定总损失；

19、基于所述总损失迭代更新所述初始特征编码模型和所述第一初始分类模型，得到所述目标特征编码模型和多层感知机分类模型。

20、在一个实施方式中，所述从所述第一图像训练集中筛选出第二图像训练集，包括：

21、从所述第一图像训练集中属于虚假类别的虚假图像样本中筛选得到虚假样本集；

22、从所述第一图像训练集中属于真实类别的真实图像样本中筛选得到真实样本集；

23、合并所述真实样本集和所述虚假样本集，得到所述第二图像训练集。

24、在一个实施方式中，所述从所述第一图像训练集中属于虚假类别的虚假图像样本中筛选得到虚假样本集，包括：

25、将所述第一图像训练集中的所述虚假图像样本输入所述目标特征编码模型，得到所述虚假图像样本的虚假图像特征；

26、将所述第一图像训练集中所有所述虚假图像样本的虚假图像特征的平均值确定为虚假图像平均特征；

27、分别计算各个所述虚假图像特征与所述虚假图像平均特征的特征相似度；

28、将与所述虚假图像平均特征之间特征相似度从大到小排序靠前的第一预设数量的所述虚假图像样本确定为第一筛选样本集，其中，第一预设数量小于所述第一图像训练集中虚假图像样本的数量；

29、在所述第一筛选样本集中随机抽取第二预设数量的所述虚假图像样本和对应的第一标注标签作为所述虚假样本集，其中，第二预设数量小于第一预设数量。

30、在一个实施方式中，所述第一图像训练集包括多个第一图像样本、多个所述第一图像样本对应的第一标注标签以及属于虚假类别的所述第一图像样本的第二标注标签，所述第二标注标签为多种伪造方式中的一个，所述冻结所述目标特征编码模型，并基于所述第二图像训练集训练第二初始分类模型，得到所述支持向量机分类模型，包括：

31、获取第三图像训练集，其中，所述第三图像训练集包括多个第二图像样本、多个所述第二图像样本对应的第一标注标签以及属于虚假类别的所述第二图像样本的第二标注标签，所述第三图像训练集中的所述第二标注标签与所述第一图像训练集的第二标注标签不同；

32、合并所述第二图像训练集和所述第三图像训练集，得到第四图像训练集，所述第四图像训练集中图像样本的数量少于第一图像训练集；

33、冻结所述目标特征编码模型，并基于所述第四图像训练集训练所述第二初始分类模型，得到所述支持向量机分类模型。

34、在一个实施方式中，所述冻结所述目标特征编码模型，并基于所述第四图像训练集训练所述第二初始分类模型，得到所述支持向量机分类模型，包括：

35、将所述第四图像训练集等分为k个子集合；

36、将k个子集合分别确定为验证集，将k个子集合除所述验证集之外的子集合确定为目标训练集；

37、获取所述第二初始分类模型的多组候选训练参数；

38、冻结所述目标特征编码模型，将所述候选训练参数作为所述第二初始分类模型的固定参数，并基于所述第一图像训练集训练所述第二初始分类模型，得到所述目标训练集对应的第三初始分类模型；

39、基于所述目标训练集对应的所述验证集验证所述目标训练集对应的第三初始分类模型，得到所述目标训练集对应的所述第三初始分类模型的模型验证参数；

40、基于多个所述目标训练集对应的所述第三初始分类模型的模型验证参数确定所述候选训练参数的总验证参数；

41、将所述总验证参数满足预设条件的所述候选训练参数确定为目标训练参数；

42、冻结所述目标特征编码模型，将所述目标训练参数作为所述第二初始分类模型的固定参数，并基于所述第四图像训练集训练所述第二初始分类模型，得到所述支持向量机分类模型。

43、第二方面，本技术实施例提供一种虚假图像检测装置，具有实现对应于上述第一方面提供的虚假图像检测方法的功能。所述功能可以通过硬件实现，也可以通过硬件执行相应的软件实现。硬件或软件包括一个或多个与上述功能相对应的模块，所述模块可以是软件和/或硬件。

44、第三方面，本技术实施例提供一种计算机可读存储介质，其包括指令，当其在计算机上运行时，使得计算机执行如第一方面所述的虚假图像检测方法。

45、第四方面，本技术实施例提供一种计算设备，包括存储器，处理器及存储在存储器上并可在处理器上运行的计算机程序，其中，所述处理器执行所述计算机程序时实现第一方面所述的虚假图像检测方法。

46、第五方面，本技术实施例提供一种芯片，该芯片中包括与终端设备的收发器耦合的处理器，用于执行本技术实施例第一方面提供的技术方案。

47、第六方面，本技术实施例提供一种芯片系统，该芯片系统包括处理器，用于支持终端设备实现上述第一方面中所涉及的功能。

48、在一种可能的设计中，上述芯片系统还包括存储器，该存储器用于保存终端必需的程序指令和数据。该芯片系统可以由芯片构成，也可以包含芯片和其他分立器件。

49、第七方面，本技术实施例提供一种包含指令的计算机程序产品，当该计算机程序产品在计算机上运行时，使得计算机执行上述第一方面所述的虚假图像检测方法。

50、相较于现有技术，本技术实施例中，获取待检测图像；基于目标特征编码模型对待检测图像进行特征提取，得到待检测图像的目标图像特征；基于多层感知机分类模型和目标图像特征对待检测图像进行图像分类，得到第一图像分类结果；基于支持向量机分类模型和目标图像特征对待检测图像进行图像分类，得到第二图像分类结果；其中，多层感知机分类模型基于第一图像训练集训练得到，支持向量机分类模型基于第二图像训练集训练得到，第二图像训练集为第一图像训练集的子集，第一图像训练集和第二图像训练集为不同的集合；基于第一图像分类和第二图像分类结果确定待检测图像的目标图像分类结果。本技术基于多层感知机的分类器和支持向量机的分类器的结合，预训练的基于多层感知机的分类器能够保持对已知伪造方式的数据的检测性能支持向量机的分类器能提高对未知伪造方式的数据的检测性能，多层感知机分类模型基于第一图像训练集训练得到，支持向量机分类模型基于第二图像训练集训练得到，第二图像训练集为第一图像训练集的子集，综合多层感知机的分类器和支持向量机的分类器的预测结果，可以提高虚假图像检测的准确性。