一种基于区块链的可验证隐私保护联邦学习方法
- 国知局
- 2024-08-02 14:55:06
本发明涉及机器学习隐私保护,特别是涉及一种基于区块链的可验证隐私保护联邦学习方法。
背景技术:
1、联邦学习(federated learning)是一种新兴的人工智能技术,原本用于解决安卓手机终端用户在本地更新模型的问题,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私、保证合法合规的前提下,在多参与方或多计算结点之间开展高效率的机器学习。联邦学习自问世以来,已经在全球的学术界和工业界得到了广泛的研究和应用。联邦学习相较于传统的机器学习算法有着许多的优势,如数据安全性、数据多样性、更高的训练效率等。
2、如今传统的联邦学习框架面临着全新的挑战。由于中心化聚合器的存在,系统面临着单点故障的风险,并且在包含不可信参与方的环境下,诸如投毒攻击、推断攻击等针对联邦学习的攻击手段都威胁着整个系统的安全。另外,也存在着不做出贡献而只获取训练收益的自私参与者,这些行为都破坏了联邦学习系统的安全性和公平性。因此,先进的隐私保护密码学技术被引入到联邦学习之中,如区块链、差分隐私、零知识证明、同态加密等,以解决这些潜在的问题。其中,区块链技术由于其提供的去中心化、匿名性、可验证性、持久性等优良的特性,可以较好的弥补现有联邦学习框架的不足之处,于是,基于区块链的联邦学习系统这一概念也应运而生。并且通过结合其他的密码学技术,能够更好的实现具有隐私保护功能的联邦学习方案。
3、面对联邦学习中的隐私问题,近年来,研究者们引入了多种密码学技术,如区块链、差分隐私、安全多方计算等,以建立具有隐私保护功能的联邦学习方案。
4、方案一:基于区块链的联邦学习方案利用了区块链的不可篡改性和持久性。awan等人提出了一个基于区块链的隐私保护联邦学习框架。在这个框架中,区块链用于连接不同的联邦学习组件,它使用一个区块链交易的分布式账本来记录信息流,利用区块链的不可篡改性来提供数据的可验证性。并且,该工作中的敌手假设可以采用恶意客户端假设而非半诚信参与者假设,这也使得在系统中部署基于贡献的激励机制变得可能。然而上述第一种方案,有如下技术缺点:
5、(1)能源消耗和效率。采用工作量证明共识机制的区块链可能会带来大量的能源消耗,联邦学习的计算任务在与采用工作量证明机制的区块链进行大量数据交互的情况下可能会使得整体系统效率变低。
6、(2)激励机制的设计困难。基于贡献的激励机制需要精心设计以确保公平性和防止操纵行为。不当设计的激励机制可能会导致恶意行为或参与不均。
7、方案二:差分隐私技术提供了一种防止隐私泄漏的方式。wei等人基于差分隐私提出了一个全新的联邦学习框架,其中客户端会在上传供聚合的更新之前在本地向其中添加噪声。上述第二种方案,有如下技术缺点:
8、数据效用的降低。引入噪声是差分隐私的核心,但这也可能导致数据质量和模型准确率的下降。以及如何将现有的差分隐私技术应用到联邦学习之中,以及在哪一训练阶段可以将噪声添加到数据之中也是值得关注的问题。
9、方案三:安全多方计算也同样被应用到隐私保护联邦学习之中。xu等人提出了一种名为hybridalpha的方案,它使用了一个基于功能性加密(functional encryption)的安全多方计算协议实现了一个隐私保护联邦学习系统。这是第一个使用功能性加密的能防御特定推断攻击的联邦学习系统。上述第三种方案,有如下技术缺点:
10、(1)计算复杂度。功能性加密和安全多方计算通常涉及复杂的数学运算和算法,这可能导致计算开销的大幅增加,尤其是在资源受限的设备上。
11、(2)难以扩展。当参与者数量增加时,协议的复杂性和计算需求可能导致系统难以扩展到大规模网络。
技术实现思路
1、为了克服现有技术的不足,本发明的目的是提供一种基于区块链的可验证隐私保护联邦学习方法。
2、为实现上述目的,本发明提供了如下方案:
3、一种基于区块链的可验证隐私保护联邦学习方法,其特征在于,包括:
4、使用中心节点分发联邦学习任务,并将当前的中心模型分发给每个参与训练的参与节点;
5、当前参与节点向区块链平台发起请求,获得一个与区块链中一笔预设交易相关联的独特标识符;
6、当前参与节点基于所述独特标识符调用可验证随机函数生成公共随机数;
7、使用所有的参与节点基于可验证随机函数对所述公共随机数进行验证,当验证结果为真时,当前参与节点利用本地数据资源对当前的中心模型进行训练得到本地模型及其相应的私有梯度数据;
8、当前参与节点基于私有梯度数据和公共随机数构建私有随机数;
9、使用zk-snark算法验证所述私有随机数是否为真,当验证结果为真时,当前参与节点调用梯度随机噪声添加链码,生成当前参与节点的加噪梯度值;
10、将当前参与节点的加噪梯度值应用到中心模型中,直到所述中心模型收敛。
11、优选的,所述当前参与节点向区块链平台发起请求,获得一个与区块链中一笔预设交易相关联的独特标识符,包括:
12、当前参与节点向区块链平台发起请求,调用公共参数和密钥生成链码并在区块链上生成一对非对称加密的公钥pk和私钥sk;
13、当前参与节点调用区块链平台提供的接口获得一个与区块链中一笔预设交易相关联的独特标识符txbinding。
14、优选的,所述当前参与节点基于所述独特标识符调用可验证随机函数生成公共随机数,包括:
15、将非对称加密的公钥pk、私钥sk及其所述的独特标识符txbinding输入到可验证随机函数中,得到公共随机数rp和证明pv,同时向所有的参与节点公布公共随机数rp、证明pv以及公钥pk;其中,所述可验证随机函数为:
16、vrf(pk,sk,txbinding=(pv,pk,rp)
17、其中,vrf表示可验证随机函数。
18、优选的,所述当前参与节点基于私有梯度数据和公共随机数构建私有随机数,包括:
19、使用mimc哈希函数基于私有梯度数据和公共随机数构建私有随机数;
20、优选的,所述mimc哈希函数为:
21、h(rp||xi)=ri
22、其中,h为哈希函数,rp为公共随机数,xi为私有梯度数据,ri为私有随机数。
23、优选的,当验证结果为真时,当前参与节点调用梯度随机噪声添加链码,生成当前参与节点的加噪梯度值,包括:
24、使用当前参与节点调用梯度随机噪声添加链码,并将链码生成的m,x'im,pi公布到区块链上,其中m链码中为简化计算所选拉普拉斯分布参数bchosen和目标拉普拉斯分布参数btarget的比值,即m=bchosen/btarget,x'im是放大后的加噪梯度值,pi是对应的零知识证明。
25、本发明还提供了一种电子设备,包括总线、收发器、存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述收发器、所述存储器和所述处理器通过所述总线相连,其特征在于,所述计算机程序被所述处理器执行时实现上述的一种基于区块链的可验证隐私保护联邦学习方法中的步骤。
26、本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现上述的一种基于区块链的可验证隐私保护联邦学习方法中的步骤。
27、本发明提供的一种基于区块链的可验证隐私保护联邦学习方法的有益效果在于:与现有技术相比,本发明通过结合差分隐私和零知识证明,在不泄漏随机种子的情况下获得映射到指定概率分布的随机噪声,并添加到上传的梯度上,使得参与节点的私有训练数据资源以及梯度传递通信过程中的隐私得到了充分的保护。
本文地址:https://www.jishuxx.com/zhuanli/20240801/244320.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。