技术新讯 > 计算推算,计数设备的制造及其应用技术 > 源模型自我增强方法、装置、电子设备及存储介质 > 正文

源模型自我增强方法、装置、电子设备及存储介质

国知局
2024-07-31 22:54:49

本发明涉及计算机视觉模型，尤其涉及一种源模型自我增强方法、装置、电子设备及存储介质。

背景技术：

1、在计算机相关领域的攻防研究中，通过研究对抗样本的生成，可以促进研究防御效果更好的基于对抗样本攻击的防御手段，从而增强计算机视觉模型的安全性。同时基于对对抗攻击或者迁移攻击的研究，不断完善防御算法与算法的相关应用。

2、在针对计算机视觉模型的黑盒对抗攻击中，攻击者由于不能得知目标模型的结构和权重信息，难以有针对性地生成对抗样本。以迁移攻击为例，迁移攻击是一种常用的黑盒攻击手段。现有方法通常将预训练的模型用于生成对抗样本。或者仅对预训练模型进行少量改动，并将改动后的模型作为源模型，用于生成对抗样本。采用这种方式所生成的对抗样本往往攻击成功率不高，可迁移性不足，导致对对抗样本的研究不够深入，难以推进基于迁移攻击的防御相关研究。

技术实现思路

1、本发明提供了一种源模型自我增强方法、装置、电子设备及存储介质，用于解决或部分解决现有源模型所生成对抗样本的可迁移性较低的问题。

2、本发明提供了一种面向定向迁移攻击的源模型自我增强方法，所述方法包括：

3、获取用于定向迁移攻击的初始源模型；

4、采用锐度感知自我蒸馏以及权重缩放对所述初始源模型进行自我增强，获得增强源模型；

5、基于所述增强源模型，生成定向迁移攻击场景下的对抗样本。

6、可选地，所述采用锐度感知自我蒸馏以及权重缩放对所述初始源模型进行自我增强，获得增强源模型，包括：

7、对所述初始源模型进行拷贝，获得拷贝模型；

8、结合锐度感知最小化以及知识蒸馏法对所述拷贝模型进行模型调整，获得锐度感知自我蒸馏模型；

9、对所述锐度感知自我蒸馏模型进行权重缩放处理，获得增强源模型。

10、可选地，所述拷贝模型包括第一拷贝模型以及第二拷贝模型，所述结合锐度感知最小化以及知识蒸馏法对所述拷贝模型进行模型调整，获得锐度感知自我蒸馏模型，包括：

11、采用锐度感知最小化对所述第一拷贝模型进行微调，获得辅助模型；

12、采用知识蒸馏法将所述辅助模型的知识蒸馏至所述第二拷贝模型中；

13、在蒸馏过程中最小化所述第二拷贝模型的蒸馏损失及其锐度，获得锐度感知自我蒸馏模型。

14、可选地，所述方法还包括：

15、在蒸馏过程中，采用kullback-leibler散度dkl作为蒸馏损失函数，以最小化所述辅助模型与所述第二拷贝模型之间的预测差异。

16、可选地，所述对所述锐度感知自我蒸馏模型进行权重缩放处理，获得增强源模型，包括：

17、将所述锐度感知自我蒸馏模型中的所有卷积层参数乘上一个预设系数，获得增强源模型。

18、可选地，所述基于所述增强源模型，生成定向迁移攻击场景下的对抗样本，包括：

19、获取预先构建的图像数据集，以及需要进行定向迁移攻击的目标模型，所述图像数据集内包括多组图像标签三元组，每一组所述图像标签三元组包括一个图像样本、一个所述图像样本对应的真实图像标签以及一个目标图像标签，所述目标图像标签不等于所述真实图像标签；

20、对于任一所述图像样本，通过最小化所述增强源模型在所述目标图像标签上的交叉熵损失，生成定向迁移攻击场景下的对抗样本，所述对抗样本用于误导所述目标模型在对所述对抗样本进行预测时，获得所述对抗样本的输出图像标签不等于所述真实图像标签的模型输出结果。

21、可选地，在生成定向迁移攻击场景下的对抗样本之后，所述方法还包括：

22、采用所述对抗样本攻击所述目标模型，以使所述目标模型基于所述对抗样本进行预测后所获得的输出图像标签，等于所述目标图像标签。

23、本发明还提供了一种面向定向迁移攻击的源模型自我增强装置，包括：

24、初始源模型获取模块，用于获取用于定向迁移攻击的初始源模型；

25、源模型自我增强模块，用于采用锐度感知自我蒸馏以及权重缩放对所述初始源模型进行自我增强，获得增强源模型；

26、对抗样本生成模块，用于基于所述增强源模型，生成定向迁移攻击场景下的对抗样本。

27、本发明还提供了一种电子设备，所述设备包括处理器以及存储器：

28、所述存储器用于存储程序代码，并将所述程序代码传输给所述处理器；

29、所述处理器用于根据所述程序代码中的指令执行如上任一项所述的源模型自我增强方法。

30、本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行如上任一项所述的源模型自我增强方法。

31、从以上技术方案可以看出，本发明具有以下优点：

32、提供了一种面向定向迁移攻击的源模型自我增强方法。首先获取用于定向迁移攻击的初始源模型；接着采用锐度感知自我蒸馏以及权重缩放对初始源模型进行自我增强，获得增强源模型；基于增强源模型，生成定向迁移攻击场景下的对抗样本。从而通过结合锐度感知自我蒸馏以及权重缩放对源模型进行自我增强，获得泛化能力更强的源模型，使得基于该源模型所生成的对抗样本具有更好的可迁移性。

技术特征：

1.一种面向定向迁移攻击的源模型自我增强方法，其特征在于，包括：

2.根据权利要求1所述的源模型自我增强方法，其特征在于，所述采用锐度感知自我蒸馏以及权重缩放对所述初始源模型进行自我增强，获得增强源模型，包括：

3.根据权利要求2所述的源模型自我增强方法，其特征在于，所述拷贝模型包括第一拷贝模型以及第二拷贝模型，所述结合锐度感知最小化以及知识蒸馏法对所述拷贝模型进行模型调整，获得锐度感知自我蒸馏模型，包括：

4.根据权利要求3所述的源模型自我增强方法，其特征在于，还包括：

5.根据权利要求2所述的源模型自我增强方法，其特征在于，所述对所述锐度感知自我蒸馏模型进行权重缩放处理，获得增强源模型，包括：

6.根据权利要求1至5任一项所述的源模型自我增强方法，其特征在于，所述基于所述增强源模型，生成定向迁移攻击场景下的对抗样本，包括：

7.根据权利要求6所述的源模型自我增强方法，其特征在于，在生成定向迁移攻击场景下的对抗样本之后，所述方法还包括：

8.一种面向定向迁移攻击的源模型自我增强装置，其特征在于，包括：

9.一种电子设备，其特征在于，所述设备包括处理器以及存储器：

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质用于存储程序代码，所述程序代码用于执行权利要求1-7任一项所述的源模型自我增强方法。

技术总结本发明公开了一种源模型自我增强方法、装置、电子设备及存储介质，用于解决现有源模型所生成对抗样本的可迁移性较低的问题。所述方法包括：获取用于定向迁移攻击的初始源模型；采用锐度感知自我蒸馏以及权重缩放对初始源模型进行自我增强，获得增强源模型；基于所述增强源模型，生成定向迁移攻击场景下的对抗样本。从而通过结合锐度感知自我蒸馏以及权重缩放对源模型进行自我增强，获得泛化能力更强的源模型，使得基于该源模型所生成的对抗样本具有更好的可迁移性。技术研发人员：吴炜滨,区冠彦,吴翰,郑子彬受保护的技术使用者：中山大学技术研发日：技术公布日：2024/7/29