一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于联邦学习的模型训练方法、装置、设备以及存储介质与流程

2021-12-07 20:09:00 来源:中国专利 TAG:


1.本技术的实施例涉及计算机技术领域,具体涉及机器学习技术领域,尤其涉及基于联邦学习的模型训练方法和装置。


背景技术:

2.随着大数据、人工智能技术的蓬勃发展,互联网金融领域对于大数据和人工智能技术的需求与日俱增。联邦学习作为一种解决“数据孤岛问题”的建模方案,是一种基于隐私安全的分布式机器学习范式,逐渐受到业内关注。联邦学习通常由一方(称为guest方)提供标签信息和部分特征信息,其他方(称为host方)提供特征信息。而在机器学习算法中,梯度提升树在具备决策树模型可解释性的同时提升了分类性能及效果。在多方安全建模的需求下,基于联邦学习技术和梯度提升树算法,某银行提出了一种基于半同态加密的梯度提升树方法,即secureboost算法。但现有secureboost算法为了防止样本信息泄露,各方之间的建模特征无法进行公开,降低了模型的可解释性,并且在现有技术方案中数据方可能通过提供恶意数据破坏模型,存在较大的安全隐患。


技术实现要素:

3.本技术提供了一种基于联邦学习的模型训练方法、装置、设备以及存储介质。
4.根据本技术的第一方面,提供了一种基于联邦学习的模型训练方法,应用于联邦学习系统中的第一电子设备,第一电子设备中存储有各个用户标识和各个用户的第一特征信息集,模型基于梯度提升树算法而构建,方法包括:当未达到梯度提升树的棵树阈值并且未达到梯度提升树的深度阈值,向联邦学习系统中的各个第二电子设备发送梯度数据,其中,梯度数据基于梯度提升树的已构建棵树的预测结果而生成,第二电子设备中存储有与第一电子设备中相同用户的第二特征信息集;接收各个第二电子设备基于梯度数据发送的表征第二特征信息集中每个特征和相应特征的分裂阈值的随机数编码和与各个随机数编码对应的第一融合梯度;基于各个第一融合梯度和第一特征信息集,确定信息增益的目标值,其中,信息增益的目标值通过对本方信息增益的最大值和各个第二电子设备信息增益的最大值进行选取而得到,本方信息增益的最大值用于表征当前节点样本空间中第一特征信息集中每个特征在每个分裂阈值分裂后的各个信息增益中的最大值,第二电子设备信息增益的最大值通过对相应的第一融合梯度进行解密而得到;响应于信息增益的目标值为本方信息增益的最大值,基于信息增益的目标值对应特征和分裂阈值对样本空间进行划分,生成样本空间划分结果和样本空间划分结果对应的目标融合梯度;根据目标融合梯度,对第一电子设备的模型参数进行更新。
5.在一些实施例中,在基于各个第一融合梯度和第一特征信息集,确定信息增益的目标值之后,还包括:响应于信息增益的目标值为第二电子设备信息增益的最大值,向第二电子设备发送信息增益的目标值对应的随机数编码;接收第二电子设备发送的样本空间划分结果和样本空间划分结果对应的目标融合梯度。
6.在一些实施例中,梯度数据用于表征各个样本的一阶梯度和二阶梯度;梯度数据通过利用加密技术对一阶梯度和二阶梯度进行加密而生成,加密技术包括同态加密技术。
7.在一些实施例中,随机数编码为表征第二特征信息集中每个特征和相应特征的分裂阈值的加密后的随机数编码。
8.在一些实施例中,随机数编码基于当前节点样本空间中第二特征信息集中每个特征标识和相应特征的分裂阈值利用打乱特征排序的方式而生成,随机数编码互不相同。
9.在一些实施例中,方法还包括:向各个第二电子设备发送样本空间划分结果;和/或,当达到梯度提升树的深度阈值,基于样本空间划分结果对模型的预测结果进行更新。
10.在一些实施例中,方法还包括:当达到梯度提升树的棵树阈值,生成训练完成后的最终模型,并将最终模型发送至各个第二电子设备;接收各个第二电子设备基于最终模型发送的与第二特征信息集中各个特征对应的贡献度。
11.根据本技术的第二方面,提供了一种基于联邦学习的模型训练系统,系统包括:第一电子设备,其中,第一电子设备用于执行上述任意一项的基于联邦学习的模型训练方法。
12.在一些实施例中,系统还包括:至少一个第二电子设备;第二电子设备,用于接收联邦学习系统中的第一电子设备发送的梯度数据;基于梯度数据,生成表征第二特征信息集中每个特征和相应特征的分裂阈值对应的随机数编码和与各个随机数编码对应的第一融合梯度,并将随机数编码和第一融合梯度发送至第一电子设备;响应于接收到第一电子设备发送的随机数编码,基于第一电子设备发送的随机数编码对应特征和分裂阈值对样本空间进行划分,生成样本空间划分结果和样本空间划分结果对应的目标融合梯度。
13.在一些实施例中,第二电子设备还用于向第一电子设备发送样本空间划分结果和样本空间划分结果对应的目标融合梯度。
14.在一些实施例中,第二电子设备还用于响应于接收到第一电子设备发送的最终模型,向第一电子设备发送与第二特征信息集中各个特征对应的贡献度,其中,贡献度基于最终模型而获得。
15.根据本技术的第三方面,提供了一种模型训练装置,应用于联邦学习系统中的第一电子设备,第一电子设备中存储有各个用户标识和各个用户的第一特征信息集,模型基于梯度提升树算法而构建,装置包括:第一发送单元,被配置成当未达到梯度提升树的棵树阈值并且未达到梯度提升树的深度阈值,向联邦学习系统中的各个第二电子设备发送梯度数据,其中,梯度数据基于梯度提升树的已构建棵树的预测结果而生成,第二电子设备中存储有与第一电子设备中相同用户的第二特征信息集;第一接收单元,被配置成接收各个第二电子设备基于梯度数据发送的表征第二特征信息集中每个特征和相应特征的分裂阈值的随机数编码和与各个随机数编码对应的第一融合梯度;确定单元,被配置成基于各个第一融合梯度和第一特征信息集,确定信息增益的目标值,其中,信息增益的目标值通过对本方信息增益的最大值和各个第二电子设备信息增益的最大值进行选取而得到,本方信息增益的最大值用于表征当前节点样本空间中第一特征信息集中每个特征在每个分裂阈值分裂后的各个信息增益中的最大值,第二电子设备信息增益的最大值通过对相应的第一融合梯度进行解密而得到;分割单元,被配置成响应于信息增益的目标值为本方信息增益的最大值,基于信息增益的目标值对应特征和分裂阈值对样本空间进行划分,生成样本空间划分结果和样本空间划分结果对应的目标融合梯度;第一更新单元,被配置成根据目标融合
梯度,对第一电子设备的模型参数进行更新。
16.在一些实施例中,装置还包括:第二发送单元,被配置成响应于信息增益的目标值为第二电子设备信息增益的最大值,向第二电子设备发送信息增益的目标值对应的随机数编码;第二接收单元,被配置成接收第二电子设备发送的样本空间划分结果和样本空间划分结果对应的目标融合梯度。
17.在一些实施例中,第一接收单元中的随机数编码为表征第二特征信息集中每个特征和相应特征的分裂阈值的加密后的随机数编码。
18.在一些实施例中,第一接收单元中的随机数编码基于当前节点样本空间中第二特征信息集中每个特征标识和相应特征的分裂阈值利用打乱特征排序的方式而生成,随机数编码互不相同。
19.在一些实施例中,装置还包括:第三发送单元,被配置成向各个第二电子设备发送样本空间划分结果;和/或,第二更新单元,被配置成当达到梯度提升树的深度阈值,基于样本空间划分结果对模型的预测结果进行更新。
20.在一些实施例中,装置还包括:生成单元,被配置成当达到梯度提升树的棵树阈值,生成训练完成后的最终模型,并将最终模型发送至各个第二电子设备;第三接收单元,被配置成接收各个第二电子设备基于最终模型发送的与第二特征信息集中各个特征对应的贡献度。
21.根据本技术的第四方面,提供了一种电子设备,包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行如第一方面中任一实现方式描述的方法。
22.根据本技术的第五方面,本技术提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其特征在于,计算机指令用于使计算机执行如第一方面中任一实现方式描述的方法。
23.根据本技术的技术采用当未达到梯度提升树的棵树阈值并且未达到梯度提升树的深度阈值,向联邦学习系统中的各个第二电子设备发送梯度数据,接收各个第二电子设备基于梯度数据发送的表征第二特征信息集中每个特征和相应特征的分裂阈值的随机数编码和与各个随机数编码对应的第一融合梯度,基于各个第一融合梯度和第一特征信息集,确定信息增益的目标值,响应于信息增益的目标值为本方信息增益的最大值,基于信息增益的目标值对应特征和分裂阈值对样本空间进行划分,生成样本空间划分结果和样本空间划分结果对应的目标融合梯度,根据目标融合梯度,对第一电子设备的模型参数进行更新,通过将特征信息生成随机数编码并以随机编码的方式进行传输,实现了一种具有可解释性的基于联邦学习的模型训练方法,解决了现有技术中因树模型节点与特征是绑定的,使得特征无法进行公开,并且若一旦公开可能会泄露样本特征信息的问题。通过将特征信息生成随机数编码,隐藏第二电子设备(即host方)节点的分裂特征,防止其他方推测模型信息的可能,保护了特征数据的安全性,实现了在host方对第一电子设备(即guest方)公开特征名称的同时保护host方隐私信息。通过在寻找节点的最大信息增益的特征过程中,不再暴露原有特征编码而是传输特征的随机数编号,使得guest方难以识别不同节点分裂特征是否一致,因此guest方无法统计每个特征参与分裂的次数,即使host方公开入模贡献
度,guest方也无法根据分裂次数相同找到对应特征所属节点,进而无法通过叶子节点数量推测样本特征,保证了特征数据的安全性。
24.应当理解,本部分所描述的内容并非旨在标识本技术的实施例的关键或重要特征,也不用于限制本技术的范围。本技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
25.附图用于更好地理解本方案,不构成对本技术的限定。
26.图1是根据本技术的基于联邦学习的模型训练方法的第一实施例的示意图;
27.图2是可以实现本技术实施例的基于联邦学习的模型训练方法的场景图;
28.图3是根据本技术的基于联邦学习的模型训练方法的第二实施例的示意图;
29.图4是根据本技术的基于联邦学习的模型训练系统的一个实施例的结构示意图;
30.图5是根据本技术的基于联邦学习的模型训练装置的一个实施例的结构示意图;
31.图6是用来实现本技术实施例的基于联邦学习的模型训练方法的电子设备的框图。
具体实施方式
32.以下结合附图对本技术的示范性实施例做出说明,其中包括本技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
33.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
34.图1示出了根据本技术的基于联邦学习的模型训练方法的第一实施例的示意图100。该方法应用于联邦学习系统的第一电子设备,该联邦学习针对纵向联邦学习而开展,系统中可以包括:至少一个第一电子设备(guest方)和至少一个第二电子设备(host方),第一电子设备中存储有各个用户标识和各个用户的第一特征信息集,第二电子设备中存储有与第一电子设备中相同用户的第二特征信息集,第一特征信息集与第二特征信息集不同。第一特征信息集与第二特征信息集在模型训练前进行了样本对齐,样本对齐具体是指通过psi技术(private set intersection)计算双方id的交集部分,在进行用户id交集部分对齐的同时不泄露双方用户id的补集,例如采用基于rsa和哈希算法,对联邦学习系统的不同参与方在不泄露其他用户id信息的情况下完成相同用户id的样本匹配。模型基于决策树模型的梯度提升树算法而构建,guest方作为决策树的根节点,具有host方认可的可信执行环境,梯度提升树(gradient boosted decision tree)算法可以基于最具代表性的梯度提升树xgboost算法多方扩展而生成。该基于联邦学习的模型训练方法,包括以下步骤:
35.步骤101,当未达到梯度提升树的棵树阈值并且未达到梯度提升树的深度阈值,向联邦学习系统中的各个第二电子设备发送梯度数据。
36.在本实施例中,当执行主体(例如云端服务器或终端设备)判断未达到梯度提升树的棵树阈值时,通过前t

1颗树构建第t颗树,直到达到梯度提升树的棵树阈值上限。当执行主体未达到梯度提升树的深度阈值时,进行节点分裂,直到达到梯度提升树的深度阈值,获
得第t棵树的训练树f
t
(x)。执行主体可以通过有线连接或无线连接的方式向联邦学习系统中的各个第二电子设备发送梯度数据。棵树阈值和深度阈值可通过本地同步训练而得到。梯度数据基于梯度提升树的已构建棵树的预测结果而生成。需要说明的是,上述无线连接方式可以包括但不限于3g、4g、5g连接、wifi连接、蓝牙连接、wimax连接、zigbee连接、uwb(ultra wideband)连接、以及其他现在已知或将来开发的无线连接方式。
37.在本实施例的一些可选的实现方式中,梯度数据用于表征各个样本的一阶梯度和二阶梯度;梯度数据通过利用加密技术对一阶梯度和二阶梯度进行加密而生成,加密技术包括同态加密技术。实现了基于二阶梯度的迭代训练,通过对传输数据进行加密,保证了数据的安全性。
38.梯度数据的生成与传输具体指:第一电子设备根据前t

1颗树的预测结果计算残差,并计算每个样本的一阶梯度和二阶梯度。第一电子设备对每一个样本的一阶梯度和二阶梯度进行pallier加法同态加密后传输给第二电子设备。
39.步骤102,接收各个第二电子设备基于梯度数据发送的表征第二特征信息集中每个特征和相应特征的分裂阈值的随机数编码和与各个随机数编码对应的第一融合梯度。
40.在本实施例中,执行主体可以接收各个第二电子设备基于梯度数据发送的与各自的第二特征信息集中每个特征和相应特征的分裂阈值对应的随机数编码和与各个随机数编码对应的第一融合梯度。随机数编码可以通过数字、字母或符号来表示。
41.这里,第二电子设备在当前样本空间下,根据本地特征的分箱信息对本地每一个特征根据分箱阈值,计算得到与每一个特征和该特征的分箱阈值对应的第一融合梯度。同时,第二电子设备根据第二特征数据集中每个特征和每个特征的分裂阈值编号随机生成对应的随机数编码,并将各个随机数编号和与各个随机数编码对应的第一融合梯度发送至第一电子设备,以使第一电子设备进行接收。
42.步骤103,基于各个第一融合梯度和第一特征信息集,确定信息增益的目标值。
43.在本实施例中,执行主体可以基于步骤102接收到的各个第一融合梯度和本地的第一特征信息集,确定信息增益的目标值。信息增益的目标值是指所有信息增益值中的最大值,即能够确定最优分裂点位置是位于第一电子设备还是位于某个第二电子设备。信息增益的目标值通过对本方信息增益的最大值和各个第二电子设备信息增益的最大值进行选取而得到,本方信息增益的最大值用于表征当前节点样本空间中第一特征信息集中每个特征在每个分裂阈值分裂后的各个信息增益中的最大值,第二电子设备信息增益的最大值通过对相应的第一融合梯度进行解密而得到。是否进行节点分裂的判断过程为,根据梯度信息计算本方分裂点和其他方每个随机数编号的分裂点得分score,若得分score小于分裂阈值则停止当前节点的分裂,否则将进行节点分裂。
44.步骤104,响应于信息增益的目标值为本方信息增益的最大值,基于信息增益的目标值对应特征和分裂阈值对样本空间进行划分,生成样本空间划分结果和样本空间划分结果对应的目标融合梯度。
45.在本实施例中,当执行主体确定信息增益的目标值为本方信息增益的最大值(即分裂点位于第一电子设备),基于信息增益的目标值对应特征和分裂阈值对样本空间进行左右子节点划分,生成样本空间划分结果和样本空间划分结果对应的目标融合梯度。
46.步骤105,根据目标融合梯度,对第一电子设备的模型参数进行更新。
47.在本实施例中,执行主体可以根据目标融合梯度,对第一电子设备的模型参数进行更新,以完成一次模型训练。
48.在本实施例的一些可选的实现方式中,方法还包括:向各个第二电子设备发送样本空间划分结果;和/或,当达到梯度提升树的深度阈值,基于样本空间划分结果对模型的预测结果进行更新。实现了模型数据的同步,以完成联邦学习的整个学习过程。
49.在本实施例的一些可选的实现方式中,方法还包括:当达到梯度提升树的棵树阈值,生成训练完成后的最终模型,并将最终模型发送至各个第二电子设备;接收各个第二电子设备基于最终模型发送的与第二特征信息集中各个特征对应的贡献度,其中,贡献度用于表征特征出现的次数。在完成节点分裂后,host方将同步本地入模特征的特征名称以及每个特征贡献度发送至guest方,用于guest方评价模型和参与方数据质量,例如贡献度可以作为衡量入模特征对模型重要性的依据,guest方可以针对建模结果进行合理性分析与评估。由于guest方获取的特征信息每次都是host方编码随机生成的,因此guest方无法获知每轮传输的特征阈值是否一致,无法获知每个特征所对应的分裂节点,从而实现了数据保护。
50.需要说明的是,上述梯度提升树算法、以及残差、梯度值计算、梯度融合计算等是目前广泛研究和应用的公知技术,在此不再赘述。
51.继续参见图2,本实施例的基于联邦学习的模型训练方法200运行于电子设备201中。当电子设备201判定未达到梯度提升树的棵树阈值并且未达到梯度提升树的深度阈值时,电子设备201首先向联邦学习系统中的各个第二电子设备发送梯度数据202,其中,梯度数据基于梯度提升树的已构建棵树的预测结果而生成,然后接收各个第二电子设备基于梯度数据发送的表征第二特征信息集中每个特征和相应特征的分裂阈值的随机数编码和与各个随机数编码对应的第一融合梯度203,接着电子设备201基于各个第一融合梯度和第一特征信息集,确定信息增益的目标值204,其中,信息增益的目标值通过对本方信息增益的最大值和各个第二电子设备信息增益的最大值进行选取而得到,当电子设备201确定信息增益的目标值为本方信息增益的最大值时,基于信息增益的目标值对应特征和分裂阈值对样本空间进行划分,生成样本空间划分结果和样本空间划分结果对应的目标融合梯度205,最后电子设备201根据目标融合梯度,对第一电子设备的模型参数进行更新206。
52.本技术的上述实施例提供的基于联邦学习的模型训练方法采用当未达到梯度提升树的棵树阈值并且未达到梯度提升树的深度阈值,向联邦学习系统中的各个第二电子设备发送梯度数据,接收各个第二电子设备基于梯度数据发送的表征第二特征信息集中每个特征和相应特征的分裂阈值的随机数编码和与各个随机数编码对应的第一融合梯度,基于各个第一融合梯度和第一特征信息集,确定信息增益的目标值,响应于信息增益的目标值为本方信息增益的最大值,基于信息增益的目标值对应特征和分裂阈值对样本空间进行划分,生成样本空间划分结果和样本空间划分结果对应的目标融合梯度,根据目标融合梯度,对第一电子设备的模型参数进行更新,通过将特征信息生成随机数编码并以随机编码的方式进行传输,实现了一种具有可解释性的基于联邦学习的模型训练方法,解决了现有技术中因树模型节点与特征是绑定的,使得特征无法进行公开,并且若一旦公开可能会泄露样本特征信息的问题。通过将特征信息生成随机数编码,隐藏第二电子设备(即host方)节点的分裂特征,防止其他方推测模型信息的可能,保护了特征数据的安全性,实现了在host方
对第一电子设备(即guest方)公开特征名称的同时保护host方隐私信息。通过在寻找节点的最大信息增益的特征过程中,不再暴露原有特征编码而是传输特征的随机数编号,使得guest方难以识别不同节点分裂特征是否一致,因此guest方无法统计每个特征参与分裂的次数,即使host方公开入模贡献度,guest方也无法根据分裂次数相同找到对应特征所属节点,进而无法通过叶子节点数量推测样本特征,保证了特征数据的安全性。
53.进一步参考图3,其示出了基于联邦学习的模型训练方法的第二实施例的示意图300。该方法的流程包括以下步骤:
54.步骤301,当未达到梯度提升树的棵树阈值并且未达到梯度提升树的深度阈值,向联邦学习系统中的各个第二电子设备发送梯度数据。
55.步骤302,接收各个第二电子设备基于梯度数据发送的表征第二特征信息集中每个特征和相应特征的分裂阈值的随机数编码和与各个随机数编码对应的第一融合梯度。
56.在本实施例中,执行主体可以接收各个第二电子设备基于梯度数据发送的与各自的第二特征信息集中每个特征和相应特征的分裂阈值对应的随机数编码和与各个随机数编码对应的第一融合梯度。随机数编码为表征第二特征信息集中每个特征和相应特征的分裂阈值的加密后的随机数编码。随机数编码基于当前节点样本空间中第二特征信息集中每个特征标识和相应特征的分裂阈值利用打乱特征排序的方式而生成,随机数编码互不相同。
57.步骤303,基于各个第一融合梯度和第一特征信息集,确定信息增益的目标值。
58.步骤304,响应于信息增益的目标值为第二电子设备信息增益的最大值,向第二电子设备发送信息增益的目标值对应的随机数编码。
59.在本实施例中,当执行主体确定信息增益的目标值为第二电子设备信息增益的最大值,向第二电子设备发送信息增益的目标值对应的随机数编码。
60.步骤305,接收第二电子设备发送的样本空间划分结果和样本空间划分结果对应的目标融合梯度。
61.在本实施例中,执行主体可以接收第二电子设备发送的样本空间划分结果和样本空间划分结果对应的目标融合梯度。
62.这里,第二电子设备可以基于接收到的随机数编码对样本空间进行左右子节点划分,生成样本空间划分结果和与样本空间划分结果对应的目标融合梯度,并发送给第一电子设备。
63.步骤306,根据目标融合梯度,对第一电子设备的模型参数进行更新。
64.在本实施例中,步骤301、303和306的具体操作与图1所示的实施例中的步骤101、103和105的操作基本相同,在此不再赘述。
65.从图3中可以看出,与图1对应的实施例相比,本实施例中的基于联邦学习的模型训练方法的示意图300采用响应于信息增益的目标值为第二电子设备信息增益的最大值,向第二电子设备发送信息增益的目标值对应的随机数编码,接收第二电子设备发送的样本空间划分结果和样本空间划分结果对应的目标融合梯度,根据目标融合梯度,对第一电子设备的模型参数进行更新,实现了基于其他方分裂的基于联邦学习的模型训练过程。通过将特征信息生成以打乱特征排列顺序的随机数编码,并对随机数编码进行加密,隐藏第二电子设备(即host方)节点的分裂特征,防止其他方推测模型信息的可能,保护了特征数据
的安全性,实现了在host方对第一电子设备(即guest方)公开特征名称的同时保护host方隐私信息。
66.进一步参考图4,本技术提供了一种基于联邦学习的模型训练系统,如图4所示,该系统包括:第一电子设备401和至少一个第二电子设备402,其中,第一电子设备,用于执行上述任意一项的基于联邦学习的模型训练方法;第二电子设备,用于接收联邦学习系统中的第一电子设备发送的梯度数据;基于梯度数据,生成表征第二特征信息集中每个特征和相应特征的分裂阈值对应的随机数编码和与各个随机数编码对应的第一融合梯度,并将随机数编码和第一融合梯度发送至第一电子设备;响应于接收到第一电子设备发送的随机数编码,基于第一电子设备发送的随机数编码对应特征和分裂阈值对样本空间进行划分,生成样本空间划分结果和样本空间划分结果对应的目标融合梯度。
67.在系统中,第二电子设备还用于向第一电子设备发送样本空间划分结果和样本空间划分结果对应的目标融合梯度。
68.在系统中,第二电子设备还用于响应于接收到第一电子设备发送的最终模型,向第一电子设备发送与第二特征信息集中各个特征对应的贡献度,其中,贡献度基于最终模型而获得。
69.该系统实现了一种具有可解释性的基于联邦学习的模型训练系统,通过第二电子设备将表征特征信息的随机数编码发送至第一电子设备,隐藏第二电子设备(即host方)节点的分裂特征,防止其他方推测模型信息的可能,保护了特征数据的安全性,实现了在host方对第一电子设备(即guest方)公开特征名称的同时保护host方隐私信息。通过在寻找节点的最大信息增益的特征过程中,不再暴露原有特征编码而是传输特征的随机数编号,使得guest方难以识别不同节点分裂特征是否一致,因此guest方无法统计每个特征参与分裂的次数,即使host方公开入模贡献度,guest方也无法根据分裂次数相同找到对应特征所属节点,进而无法通过叶子节点数量推测样本特征,保证了特征数据的安全性。
70.进一步参考图5,作为对上述图1~3所示方法的实现,本技术提供了一种基于联邦学习的模型训练装置的一个实施例,该装置实施例与图1所示的方法实施例相对应,除下面所记载的特征外,该装置实施例还可以包括与图1所示的方法实施例相同或相应的特征,以及产生与图1所示的方法实施例相同或相应的效果,该装置具体可以应用于各种电子设备中。
71.如图5所示,本实施例的基于联邦学习的模型训练装置500应用于联邦学习系统中的第一电子设备,第一电子设备中存储有各个用户标识和各个用户的第一特征信息集,装置包括:第一发送单元501、第一接收单元502、确定单元503、分割单元504和第一更新单元505,其中,第一发送单元,被配置成当未达到梯度提升树的棵树阈值并且未达到梯度提升树的深度阈值,向联邦学习系统中的各个第二电子设备发送梯度数据,其中,梯度数据基于梯度提升树的已构建棵树的预测结果而生成,第二电子设备中存储有与第一电子设备中相同用户的第二特征信息集;第一接收单元,被配置成接收各个第二电子设备基于梯度数据发送的表征第二特征信息集中每个特征和相应特征的分裂阈值的随机数编码和与各个随机数编码对应的第一融合梯度;确定单元,被配置成基于各个第一融合梯度和第一特征信息集,确定信息增益的目标值,其中,信息增益的目标值通过对本方信息增益的最大值和各个第二电子设备信息增益的最大值进行选取而得到,本方信息增益的最大值用于表征当前
节点样本空间中第一特征信息集中每个特征在每个分裂阈值分裂后的各个信息增益中的最大值,第二电子设备信息增益的最大值通过对相应的第一融合梯度进行解密而得到;分割单元,被配置成响应于信息增益的目标值为本方信息增益的最大值,基于信息增益的目标值对应特征和分裂阈值对样本空间进行划分,生成样本空间划分结果和样本空间划分结果对应的目标融合梯度;第一更新单元,被配置成根据目标融合梯度,对第一电子设备的模型参数进行更新。
72.在本实施例中,基于联邦学习的模型训练装置500的第一发送单元501、第一接收单元502、确定单元503、分割单元504和第一更新单元505的具体处理及其所带来的技术效果可分别参考图1对应的实施例中的步骤101到步骤105的相关说明,在此不再赘述。
73.在本实施例的一些可选的实现方式中,装置还包括:第二发送单元,被配置成响应于信息增益的目标值为第二电子设备信息增益的最大值,向第二电子设备发送信息增益的目标值对应的随机数编码;第二接收单元,被配置成接收第二电子设备发送的样本空间划分结果和样本空间划分结果对应的目标融合梯度。
74.在本实施例的一些可选的实现方式中,第一接收单元中的随机数编码为表征第二特征信息集中每个特征和相应特征的分裂阈值的加密后的随机数编码。
75.在本实施例的一些可选的实现方式中,第一接收单元中的随机数编码基于当前节点样本空间中第二特征信息集中每个特征标识和相应特征的分裂阈值利用打乱特征排序的方式而生成,随机数编码互不相同。
76.在本实施例的一些可选的实现方式中,装置还包括:第三发送单元,被配置成向各个第二电子设备发送样本空间划分结果;和/或,第二更新单元,被配置成当达到梯度提升树的深度阈值,基于样本空间划分结果对模型的预测结果进行更新。
77.在本实施例的一些可选的实现方式中,装置还包括:生成单元,被配置成当达到梯度提升树的棵树阈值,生成训练完成后的最终模型,并将最终模型发送至各个第二电子设备;第三接收单元,被配置成接收各个第二电子设备基于最终模型发送的与第二特征信息集中各个特征对应的贡献度。
78.根据本技术的实施例,本技术还提供了一种电子设备和一种可读存储介质。
79.如图6所示,是根据本技术实施例的基于联邦学习的模型训练方法的电子设备的框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本技术的实现。
80.如图6所示,该电子设备包括:一个或多个处理器601、存储器602,以及用于连接各部件的接口,包括高速接口和低速接口。各个部件利用不同的总线互相连接,并且可以被安装在公共主板上或者根据需要以其它方式安装。处理器可以对在电子设备内执行的指令进行处理,包括存储在存储器中或者存储器上以在外部输入/输出装置(诸如,耦合至接口的显示设备)上显示gui的图形信息的指令。在其它实施方式中,若需要,可以将多个处理器和/或多条总线与多个存储器和多个存储器一起使用。同样,可以连接多个电子设备,各个设备提供部分必要的操作(例如,作为服务器阵列、一组刀片式服务器、或者多处理器系
统)。图6中以一个处理器601为例。
81.存储器602即为本技术所提供的非瞬时计算机可读存储介质。其中,存储器存储有可由至少一个处理器执行的指令,以使至少一个处理器执行本技术所提供的基于联邦学习的模型训练方法。本技术的非瞬时计算机可读存储介质存储计算机指令,该计算机指令用于使计算机执行本技术所提供的基于联邦学习的模型训练方法。
82.存储器602作为一种非瞬时计算机可读存储介质,可用于存储非瞬时软件程序、非瞬时计算机可执行程序以及模块,如本技术实施例中的基于联邦学习的模型训练方法对应的程序指令/模块(例如,附图5所示的第一发送单元501、第一接收单元502、确定单元503、分割单元504和第一更新单元505)。处理器601通过运行存储在存储器602中的非瞬时软件程序、指令以及模块,从而执行服务器的各种功能应用以及数据处理,即实现上述方法实施例中的基于联邦学习的模型训练方法。
83.存储器602可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据基于联邦学习的模型训练电子设备的使用所创建的数据等。此外,存储器602可以包括高速随机存取存储器,还可以包括非瞬时存储器,例如至少一个磁盘存储器件、闪存器件、或其他非瞬时固态存储器件。在一些实施例中,存储器602可选包括相对于处理器601远程设置的存储器,这些远程存储器可以通过网络连接至基于联邦学习的模型训练电子设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
84.基于联邦学习的模型训练方法的电子设备还可以包括:输入装置603和输出装置604。处理器601、存储器602、输入装置603和输出装置604可以通过总线或者其他方式连接,图6中以通过总线连接为例。
85.输入装置603可接收输入的数字或字符信息,以及产生与基于联邦学习的模型训练电子设备的用户设置以及功能控制有关的键信号输入,例如触摸屏、小键盘、鼠标、轨迹板、触摸板、指示杆、一个或者多个鼠标按钮、轨迹球、操纵杆等输入装置。输出装置604可以包括显示设备、辅助照明装置(例如,led)和触觉反馈装置(例如,振动电机)等。该显示设备可以包括但不限于,液晶显示器(lcd)、发光二极管(led)显示器和等离子体显示器。在一些实施方式中,显示设备可以是触摸屏。
86.此处描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、专用asic(专用集成电路)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
87.这些计算程序(也称作程序、软件、软件应用、或者代码)包括可编程处理器的机器指令,并且可以利用高级过程和/或面向对象的编程语言、和/或汇编/机器语言来实施这些计算程序。如本文使用的,术语“机器可读介质”和“计算机可读介质”指的是用于将机器指令和/或数据提供给可编程处理器的任何计算机程序产品、设备、和/或装置(例如,磁盘、光盘、存储器、可编程逻辑装置(pld)),包括,接收作为机器可读信号的机器指令的机器可读
介质。术语“机器可读信号”指的是用于将机器指令和/或数据提供给可编程处理器的任何信号。
88.为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
89.可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
90.计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端

服务器关系的计算机程序来产生客户端和服务器的关系。
91.根据本技术实施例的技术方案采用当未达到梯度提升树的棵树阈值并且未达到梯度提升树的深度阈值,向联邦学习系统中的各个第二电子设备发送梯度数据,接收各个第二电子设备基于梯度数据发送的表征第二特征信息集中每个特征和相应特征的分裂阈值的随机数编码和与各个随机数编码对应的第一融合梯度,基于各个第一融合梯度和第一特征信息集,确定信息增益的目标值,响应于信息增益的目标值为本方信息增益的最大值,基于信息增益的目标值对应特征和分裂阈值对样本空间进行划分,生成样本空间划分结果和样本空间划分结果对应的目标融合梯度,根据目标融合梯度,对第一电子设备的模型参数进行更新,通过将特征信息生成随机数编码并以随机编码的方式进行传输,实现了一种具有可解释性的基于联邦学习的模型训练方法,解决了现有技术中因树模型节点与特征是绑定的,使得特征无法进行公开,并且若一旦公开可能会泄露样本特征信息的问题。通过将特征信息生成随机数编码,隐藏第二电子设备(即host方)节点的分裂特征,防止其他方推测模型信息的可能,保护了特征数据的安全性,实现了在host方对第一电子设备(即guest方)公开特征名称的同时保护host方隐私信息。通过在寻找节点的最大信息增益的特征过程中,不再暴露原有特征编码而是传输特征的随机数编号,使得guest方难以识别不同节点分裂特征是否一致,因此guest方无法统计每个特征参与分裂的次数,即使host方公开入模贡献度,guest方也无法根据分裂次数相同找到对应特征所属节点,进而无法通过叶子节点数量推测样本特征,保证了特征数据的安全性。
92.应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本技术中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本技术公开的技术方案所期望的结果,本文在此不进行限制。
93.上述具体实施方式,并不构成对本技术保护范围的限制。本领域技术人员应该明
白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本技术的精神和原则之内所作的修改、等同替换和改进等,均应包含在本技术保护范围之内。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献