技术新讯 > 电子通信装置的制造及其应用技术 > 基于向量不经意估值的FATE联邦隐私集合求交方法及系统  >  正文

基于向量不经意估值的FATE联邦隐私集合求交方法及系统

  • 国知局
  • 2024-11-19 09:48:42

本发明涉及fate联邦隐私集合求交方法及系统,尤其涉及基于向量不经意估值的fate联邦隐私集合求交方法及系统,属于隐私集合求交。

背景技术:

1、现有技术中,fate联邦学习框架包括:(1)数据的提供方host,通常它是一个合作的机构负责提供数据来复制guest完成建模,帮助提升训练效果;(2)数据的应用方guest,通常是在实际建模场景在那个有业务需求去应用数据的参与方,在纵向联邦学习中,guest通常是有标签y的一方;(3)第三方协助者arbiter,辅助多方完成联合建模任务,不提供数据,主要负责发放公钥,加解密和聚合模型等;参考图2,fate框架自上而下分为四层,具体如下:(1)应用层:fateboard是fate可视化界面,为用户提供可视化和度量模型训练的全过程,使用户能够便捷地查看模型训练过程中的各项关键指标;(2)互联互通层:fate flow是fate任务调度器,连接了数据库db、通信模块osx和算法容器层container,处于框架中枢地位,负责解析dsl依赖以及运行相关作业任务,处理如创建、停止等调度任务,并将指令下达给各个参与方;(3)算法容器层:federatedml是算法本地运行环境,包括许多常见机器学习算法的实现以及必要工具,确保算法的高效执行;(4)平台资源层:fate框架整合了众多高性能计算框架和文件管理组件,包括机器学习领域的高性能计算框架eggroll、开源大数据处理引擎spark以及分布式文件系统hdfs等,上述组件共同构成了fate平台的计算和存储资源,为各类机器学习任务提供了强大的支持。

2、传统的fate联邦学习框架中隐私求交技术的具体实现方案,主要包括以下两种:(1)基于diffie-hellman的隐私集合求交,参考图3,基于diffie-hellman的隐私集合求交利用了diffie-hellman密钥交换原理,第一参与方p0与第二参与方p1分别持有第一隐私求交集合x和第二隐私求交集合y,双方共同约定哈希函数hash,并分别选择第一随机密钥k0和第二随机密钥k1,具体步骤如下:第一步,第一参与方p0将哈希函数hash作用于第一隐私求交集合x的每个元素上,并计算出哈希结果的k0次方,得到第一集合发送给第二参与方p1;第二步,第二参与方p1同样将哈希函数hash作用于第二隐私求交集合y的每个元素上,并计算出哈希结果的k1次方,同时第二参与方p1计算第一参与方p0发送过来的第一集合每个元素的k1次方,将得到的第二集合和第三集合发送给第一参与方p0;第三步,第一参与方p0计算出第二参与方p1发送过来第二集合每个元素的k0次方得到第四集合并寻找第四集合与第三集合中元素的交集;最后,第一参与方p0将交集的结果告知第一参与方p1;(2)基于盲签名rsa的隐私集合求交,参考图4,第一参与方p0与第二参与方p1分别持有第一隐私求交集合x和第二隐私求交集合y,双方共同确定第一哈希函数h1和第二哈希函数h2,由第二参与方p1选择rsa加密的公钥(nrsa,ersa)和私钥(nrsa,drsa),并将公钥(nrsa,ersa)发送给第一参与方p0,具体步骤如下:第一步,对于位于第一隐私求交集合x中的每个元素xi,第一参与方p0选择随机掩码ri进行计算,将得到的第四集合x'发送给第二参与方p1;第二步,第二参与方p1利用私钥(nrsa,drsa)加密第四集合x'中的每个元素得到加密集合signedx,因为其中每个元素都被随机掩码ri掩盖,所以称上述过程为盲签名,同时,通过第二参与方p1计算出第五集合y”,将第五集合y”与加密集合signedx一起发送给第一参与方p0;第三步,第二参与方p1去除加密集合signedx中的随机掩码ri,得到第六集合x”,两个参与方比较第六集合x”和第五集合y”,得到双方集合的共同元素;基于diffie-hellman的隐私集合求交和基于盲签名rsa的隐私集合求交的主要缺点在于大量使用了公钥加密计算导致方案在处理大规模数据集合时计算量较大、运行时间长,另外,上述两种隐私求交方案无法抵抗恶意敌手,无法应用于恶意场景中。

3、综上所述,针对上述fate中隐私求交实现方法的计算效率和安全性问题,需要一种具备较高安全性的、以较低计算代价完成隐私求交任务的隐私集合求交方法。

技术实现思路

1、在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,这个概述并不是关于本发明的穷举性概述。它并不是意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。

2、鉴于此,为解决现有技术中传统的隐私集合求交方法无法应用于恶意场景且效率低的问题,本发明提供基于向量不经意估值的fate联邦隐私集合求交方法及系统。

3、技术方案一如下:基于向量不经意估值的fate联邦隐私集合求交方法,包括以下步骤:

4、s1.基于带噪声奇偶性学习问题通过初始化和拓展生成vole元组,得到vole协议;

5、s2.第一参与方和第二参与方运行vole协议,得到向量和标量,结合设置伪随机函数的估值密钥构建oprf协议;

6、s3.基于oprf协议识别出第一参与方和第二参与方所持有的集合中的相同元素,实现隐私集合求交。

7、进一步地,所述s1中,初始化setup阶段选择输入域[n]上势为t的子集s和长度为t的随机向量y,s={s1,s1,…,st},为群上长度为t的向量的集合,随机选择第一组合向量(a,b),为数域上长度为k的向量的集合,a为第一向量,b为第二向量,计算第三向量c,c=ax+b,x为数据,对第一密钥k0和第二密钥k1进行多点函数秘密共享mpfss和种子生成gen操作,(k0,k1)=mpfss.gen(1λ,fs,xy),其中,(k0,k1)为第二组合向量,1λ为安全参数,fs,xy为多点函数,对于集合s中的每个元素si,函数在si处的取值为x·yi,对于不在集合s中的任意元素z,多点函数fs,xy在z处的值为0,产生第一种子seed0和第二种子seed1,为上述加法和乘法运算所定义的数域,

8、拓展expand阶段,当索引σ=0时,解压第一种子seed0,计算由扩展函数spreadn定义的长度为n的稀疏向量μ,μ←spreadn(s,y),稀疏向量μ表示多点函数fs,y的值域向量spreadn(s,y),即对于集合s中的每个元素si,稀疏向量μ在si处的取值为yi,对于不在集合s中的任意元素z,稀疏向量μ在z处的值为0,对第一密钥k0进行函数估值fulleval,v0=mpfss.fulleval(0,k0),其中,v0为多点函数fs,xy的值域向量spreadn(s,xy)的第一秘密共享,输出第二组合向量其中,为第一输入向量,为第二输入向量,ck,n为两个参与方共知的随机矩阵,为数域上k行n列的所有二维矩阵的集合,σ=1时,解压第二种子对第一密钥k0进行函数估值fulleval,v1=mpfss.fulleval(1,k1),v1为多点函数fs,xy的值域向量spreadn(s,xy)的第二秘密共享,满足spreadn(s,xy)=v0+v1,得到输出向量

9、进一步地,所述s2中,第一参与方p0和第二参与方p1运行vole协议,第一参与方p0得到第四向量a和第六向量c,第二参与方p1得到第五向量b和标量δ,且满足c=a·δ+b,同时第四向量a、第五向量b和第六向量c均属于为数域上长度为m的向量的集合,标量δ属于数域m为第一参与方p0与第二参与方p1确定的vole协议输出的向量长度;

10、第一参与方p0和第二参与方p1共同选择一个随机矩阵m*,第一参与方p0定义一个矩阵m,m∈{0,1}n×m,矩阵m的第i行等于随机矩阵m*的第xi行,第一参与方p0通过求解方程组m·pt=(0,0,…,0)t,t为转置,得到第七向量p,第一参与方p0将第四向量a和第七向量p发送给第二参与方p1,第二参与方p1设置伪随机函数的估值密钥k;

11、估值密钥k表示为:

12、k=b+δ(a+p)

13、通过求值密钥k得到mkt=m·bt+δ(m·at+m·pt)=mbt+δmat=mct,设置伪随机函数其中,h为随机预言机,表示矩阵m*第x行,对应于oprf协议中,第一参与方p0获得数据x在伪随机函数下的估值,第二参与方p1通过估值密钥k计算出任意输入随机向量y在随机向量函数下的估值fk(y)。

14、进一步地,所述s3中,对于第一参与方p0的第一隐私求交集合x中的每个元素,第一参与方p0和第二参与方p1通过执行oprf协议,使得第一参与方p0得到估值结果而第二参与方p1得到第二参与方的估值密钥ki,利用第二参与方的估值密钥ki对第二参与方p1的第二隐私求交集合y中的元素进行估值,并将所有估值结果发送给第一参与方p0,比较估值结果通过第一参与方p0识别出第一隐私求交集合x和第二隐私求交集合y中的相同元素。

15、技术方案二:基于向量不经意估值的fate联邦隐私集合求交系统,用于实现技术方案一所述的基于向量不经意估值的fate联邦隐私集合求交方法,包括框架层、组件层、接口层和函数层;

16、所述框架层包括fate board前端界面和faderatedml任务调度组件;

17、所述组件层包括隐私集合求交host端组件、隐私集合求交guest端组件和数据库,隐私集合求交host端组件和隐私集合求交guest端组件与对应的数据库连接;

18、所述接口层用于实现c++-python的跨语言函数调用和数据接口转化;

19、所述函数层包括通过传输控制协议tcp连接隐私求交协议vole-psi的发送方和接收方;

20、所述faderatedml任务调度组件与隐私集合求交host端组件和隐私集合求交guest端组件分别连接,隐私集合求交host端组件和隐私集合求交guest端组件均与接口层连接,接口层与发送方和接收方分别连接。

21、本发明的有益效果如下:本发明基于带噪声奇偶性学习问题通过初始化和拓展得到vole协议,对第一参与方和第二参与方运行vole协议,设置伪随机函数的估值密钥构建oprf协议,基于oprf协议识别出第一参与方和第二参与方所持有的集合中的相同元素,即基于向量不经意估值实现隐私集合求交公钥加密运算;且本发明相比与基于diffie-hellman密钥交换和基于盲签名rsa的隐私集合求交方法大量使用公钥加密计算,本发明计算量少、运算时间短、具有更高的计算效率;本发明可以拓展到恶意安全下的隐私集合求交,而基于diffie-hellman密钥交换和基于盲签名rsa的隐私集合求交方法只能在半诚实场景下使用,本发明具有更强的安全性。

本文地址:https://www.jishuxx.com/zhuanli/20241118/330328.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。