技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于联邦学习的模型训练方法及装置 > 正文

一种基于联邦学习的模型训练方法及装置

国知局
2024-09-19 14:41:07

本申请涉及数据安全处理，具体涉及一种基于联邦学习的模型训练方法及装置。

背景技术：

1、作为分布式机器学习的新兴范例，联邦学习通过客户端关联来解决学习任务，无需暴露其原始数据。与传统的机器学习方法相比，联邦学习实现了在海量数据上训练更大的模型，但由于其分布式性质很容易受到投毒攻击，其中恶意客户端通过向服务器发送受操纵的模型更新数据来破坏全局模型。

2、尽管近年来联邦学习中模型投毒防御研究取得了重大进展，但现有的多数方案依赖服务器收集和维护一个干净的验证数据集来识别攻击。这样的防御方案会存在隐私泄露风险，不符合联邦学习隐私保护原则。此外，如何防御大规模恶意客户端仍是一个挑战。

技术实现思路

1、有鉴于此，本申请实施例提供一种基于联邦学习的模型训练方法及装置，实现了不依赖服务器上的验证数据集的条件下对恶意客户端的准确检测，以利用可信客户端对全局模型进行训练更新。

2、为解决上述问题，本申请实施例提供的技术方案如下：

3、在本申请第一方面，提供了一种基于联邦学习的模型训练方法，该方法应用于服务器，包括：

4、获取可信集合和非可信集合，所述可信集合包括可信客户端，所述非可信集合中包括非可信客户端，所述可信客户端用于模型训练；

5、针对所述可信集合和所述非可信集合，执行以下目标操作：

6、针对任一可信客户端，基于所述可信客户端的模型更新数据与其他任一可信客户端的模型更新数据之间的相似度获取所述可信客户端的可疑分数；

7、针对任一非可信客户端，基于所述非可信客户端的模型更新数据与所述可信客户端的模型更新数据之间的相似度获取所述非可信客户端的可信分数；

8、基于所述可信客户端的可疑分数以及所述非可信客户端的可信分数对所述可信集合和所述非可信集合进行更新；

9、利用更新后的可信集合中的可信客户端所发送的模型更新数据对全局模型进行更新，并向所有客户端发送更新后的全局模型，利用所述更新后的可信集合和更新后的非可信集合执行下一轮训练。

10、在本申请第二方面，提供了一种基于联邦学习的模型训练装置，所述装置包括：

11、获取单元，用于获取可信集合和非可信集合，所述可信集合包括可信客户端，所述非可信集合中包括非可信客户端，所述可信客户端用于模型训练；

12、针对所述可信集合和所述非可信集合，执行以下目标操作：

13、所述获取单元，还用于针对任一可信客户端，基于所述可信客户端的模型更新数据与其他任一可信客户端的模型更新数据之间的相似度获取所述可信客户端的可疑分数；

14、所述获取单元，还用于针对任一非可信客户端，基于所述非可信客户端的模型更新数据与所述可信客户端的模型更新数据之间的相似度获取所述非可信客户端的可信分数；

15、更新单元，用于基于所述可信客户端的可疑分数以及所述非可信客户端的可信分数对所述可信集合和所述非可信集合进行更新；

16、训练单元，用于利用更新后的可信集合中的可信客户端所发送的模型更新数据对全局模型进行更新，并向所有客户端发送更新后的全局模型，利用所述更新后的可信集合和更新后的非可信集合执行下一轮训练。

17、在本申请实施例第三方面，提供了一种服务器，包括：处理器，存储器；

18、所述存储器，用于存储计算机可读指令或者计算机程序；

19、所述处理器，用于读取所述计算机可读指令或所述计算机程序，以使得所述服务器实现第一方面所述的法。

20、在本申请第四方面，提供了一种计算机可读存储介质，所述计算机可读存储介质中存储有指令，当所述指令在服务器上运行时，使得所述服务器执行第一方面所述的方法。

21、在本申请第五方面，提供了一种计算机程序产品，当所述计算机程序产品在计算机上运行时，使得计算机执行第一方面所述的方法。

22、由此可见，本申请实施例具有如下有益效果：

23、本申请中，预先构建一个具有少量可信客户端(例如只包括一个可信客户端)的可信集合和包括非可信客户端的非可信集合。针对可信客户端，基于可信客户端的模型更新数据，计算任意两个可信客户端的相似度，基于该相似度确定可信客户端的可疑分数。针对非可信客户端，基于模型更新数据，计算非可信客户端与可信客户端的相似度，基于该相似度确定非可信客户端的可信分数。基于可信客户端的可疑分数以及非可信客户端的可信分数对可信集合和非可信集合进行更新。然后，利用可信集合中可信客户端所上传的模型更新参数对全局模型进行更新，并向所有客户端发送更新后的全局模型，利用更新后的可信集合和更新后的非可信集合执行下一轮训练，从而实现全局模型的训练。即，本申请从一个具有少量可信客户端的初始可信集合开始，基于可信客户端的信任引导，不断更新可信集合，然后利用可信集合中可信客户端的模型更新数据实现全局模型的训练，无需收集和维护一个干净的验证数据集，从而避免了隐私泄露风险。同时，通过准确选择可信客户端参与模型训练，可以防御超过50％比例的恶意客户端，提高联邦学习的鲁棒性。

技术特征：

1.一种基于联邦学习的模型训练方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述基于所述可信客户端的可疑分数以及所述非可信客户端的可信分数对所述可信集合和所述非可信集合进行更新，包括：

3.根据权利要求2所述的方法，其特征在于，基于所述可信客户端的可疑分数从所述可信集合中选择第二客户端，包括：

4.根据权利要求1所述的方法，其特征在于，所述基于所述可信客户端的模型更新数据与其他任一可信客户端的模型更新数据之间的相似度获取所述可信客户端的可疑分数，包括：

5.根据权利要求1所述的方法，其特征在于，基于所述非可信客户端的模型更新数据与所述可信客户端的模型更新数据之间的相似度获取所述非可信客户端的可信分数，包括：

6.根据权利要求1所述的方法，其特征在于，若所述模型更新数据为模型参数梯度，利用更新后的可信集合中的可信客户端所发送的模型更新数据对全局模型进行更新，包括：

7.根据权利要求6所述的方法，其特征在于，基于上一轮的全局梯度以及修剪参数对本轮各可信客户端所发送的局部梯度进行修剪，获得本轮的全局梯度，包括：

8.根据权利要求1所述的方法，其特征在于，所述方法还包括：

9.一种基于联邦学习的模型训练装置，其特征在于，所述装置包括：

10.一种服务器，其特征在于，包括：处理器，存储器；

技术总结本申请公开了一种基于联邦学习的模型训练方法，预先构建一个具有少量可信客户端的可信集合和包括非可信客户端的非可信集合。基于模型更新数据，计算任意两个可信客户端的相似度，基于该相似度确定可信客户端的可疑分数。基于模型更新数据，计算非可信客户端与可信客户端的相似度，基于该相似度确定非可信客户端的可信分数。基于可信客户端的可疑分数以及非可信客户端的可信分数对可信集合和非可信集合进行更新。利用可信集合中可信客户端上传的模型更新参数对全局模型进行更新。即本申请从一个具有少量可信客户端的可信集合开始，基于可信客户端的信任引导，不断更新可信集合，无需收集和维护干净的验证数据集，避免了隐私泄露风险。技术研发人员：夏辉,王祥祥,徐硕,张睿,张颖奇受保护的技术使用者：中国海洋大学技术研发日：技术公布日：2024/9/17