技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于TEE和联邦学习的数据共享方法及系统与流程 > 正文

基于TEE和联邦学习的数据共享方法及系统与流程

国知局
2025-01-10 13:33:59

本发明涉及联邦学习，具体涉及基于tee和联邦学习的数据共享方法及系统。

背景技术：

1、tee，即可信执行环境(trusted execution environment)，是一种通过硬件和软件共同构建的隔离、安全的执行环境。它允许代码在隔离的、受保护的区域内执行，不受操作系统或其他软件组件的干扰，从而提供更高层次的数据保护和安全性。而联邦学习则是一种带有隐私保护的分布式机器学习框架。它允许多个设备或计算节点在不共享原始数据的情况下进行模型训练。具体来说，各参与方在本地利用本地数据进行模型训练，并将模型的更新参数发送到中央服务器进行聚合，从而构建出更精准的全局模型。

2、在当前主流的联邦学习算法中，通常会采用差分隐私、安全多方计算、同态加密等技术解决不同阶段的安全计算问题。其中，为了保障联合建模过程中参数交互计算过程的安全性，通常会采用同态加密算法，实现预测模型的联合确立。同态加密虽然在联邦学习过程中凸显出一定的优势，如提供了显著的隐私保护效果，但仍然存在以下问题：

3、1.同态加密操作相比于明文操作要复杂得多，这导致在处理大规模数据或进行复杂计算时，同态加密会显著增加计算资源的需求和处理时间，最终导致模型训练变得极为缓慢。

4、2.同态加密后的数据通常比原始数据大得多，这意味着在联邦学习的过程中，需要在参与者之间传输更大的数据量，从而增加了通信开销。

5、3.在某些同态加密方案中，计算过程中会累计噪声，如果噪声管理不当，过度的噪声积累可能导致最终的学习结果精度下降或解密失败。

6、综上，现有的联邦学习场景下存在采用同态加密导致的计算效率低、通信开销大、噪声积累导致学习结果精度下降的技术问题。

技术实现思路

1、本申请提供了基于tee和联邦学习的数据共享方法及系统，用于针对解决现有技术中联邦学习场景下存在采用同态加密导致的计算效率低、通信开销大、噪声积累导致学习结果精度下降的技术问题。

2、鉴于上述问题，本申请提供了基于tee和联邦学习的数据共享方法及系统。

3、第一方面，本申请提供了基于tee和联邦学习的数据共享方法，所述方法包括：

4、获取多个数据参与方，对所述多个数据参与方建立多个可信执行环境；

5、在所述多个可信执行环境创立多个执行节点；

6、按照预定目标智能模型特征，以所述多个执行节点分别根据所述多个数据参与方的本地数据样本训练智能模型，得到多个本地智能模型；

7、基于所述多个数据参与方的数据共享请求进行数据共享对象识别，得到共享识别参与组；

8、通过所述多个执行节点将属于所述共享识别参与组的多个本地智能模型的多个模型参数发送至中央聚合器进行聚合，得到全局智能模型；

9、将所述全局智能模型返回至所述多个数据参与方。

10、第二方面，本申请提供了基于tee和联邦学习的数据共享系统，所述系统包括：

11、可信执行环境建立模块，用于获取多个数据参与方，对所述多个数据参与方建立多个可信执行环境；

12、执行节点创立模块，用于在所述多个可信执行环境创立多个执行节点；

13、模型训练模块，用于按照预定目标智能模型特征，以所述多个执行节点分别根据所述多个数据参与方的本地数据样本训练智能模型，得到多个本地智能模型；

14、共享对象识别模块，用于基于所述多个数据参与方的数据共享请求进行数据共享对象识别，得到共享识别参与组；

15、全局智能模型获得模块，用于通过所述多个执行节点将属于所述共享识别参与组的多个本地智能模型的多个模型参数发送至中央聚合器进行聚合，得到全局智能模型；

16、返回模块，用于将所述全局智能模型返回至所述多个数据参与方。

17、本申请中提供的一个或多个技术方案，至少具有如下技术效果或优点：

18、本申请提供的基于tee和联邦学习的数据共享方法，通过获取多个数据参与方，对所述多个数据参与方建立多个可信执行环境；在所述多个可信执行环境创立多个执行节点；按照预定目标智能模型特征，以所述多个执行节点分别根据所述多个数据参与方的本地数据样本训练智能模型，得到多个本地智能模型；基于所述多个数据参与方的数据共享请求进行数据共享对象识别，得到共享识别参与组；通过所述多个执行节点将属于所述共享识别参与组的多个本地智能模型的多个模型参数发送至中央聚合器进行聚合，得到全局智能模型；将所述全局智能模型返回至所述多个数据参与方，解决了现有技术中联邦学习场景下存在采用同态加密导致的计算效率低、通信开销大、噪声积累导致学习结果精度下降的技术问题，实现了一种高效且安全的数据共享方案，达到了在不牺牲安全性的前提下，确保了数据共享的高效率和可靠性的技术效果，并具有低通信开销、不牺牲精度等特点。

技术特征：

1.基于tee和联邦学习的数据共享方法，其特征在于，包括：

2.如权利要求1所述的方法，其特征在于，基于所述多个数据参与方的数据共享请求进行数据共享对象识别，得到共享识别参与组，包括：

3.如权利要求1所述的方法，其特征在于，所述多个执行节点将属于所述共享识别参与组的多个本地智能模型的多个模型参数发送至中央聚合器进行聚合，得到全局智能模型，包括：

4.如权利要求3所述的方法，其特征在于，基于所述多个模型损失函数进行迭代训练，得到所述全局智能模型，包括：

5.如权利要求3所述的方法，其特征在于，所述多个执行节点将属于所述共享识别参与组的多个本地智能模型的多个模型参数发送至中央聚合器进行联邦学习，包括：

6.如权利要求3所述的方法，其特征在于，将所述第一聚合模型返回至所述多个执行节点，通过所述多个执行节点利用本地数据样本对所述第一聚合模型进行损失分析，得到多个模型损失函数，包括：

7.如权利要求1所述的方法，其特征在于，所述预定目标智能模型特征包括模型输入特征、模型输出特征和模型网络特征。

8.基于tee和联邦学习的数据共享系统，其特征在于，用于实施权利要求1-7任一项所述的基于tee和联邦学习的数据共享方法，所述系统包括：

技术总结本申请提供的基于TEE和联邦学习的数据共享方法，涉及联邦学习技术领域，通过对多个数据参与方建立可信执行环境并在其中创立执行节点；按照预定目标智能模型特征，以执行节点根据数据参与方的本地数据样本训练智能模型，得到本地智能模型；基于参与方的共享请求进行共享对象识别，得到共享识别参与组；通过执行节点将属于共享识别参与组的本地智能模型的模型参数发送至中央聚合器进行聚合，得到全局智能模型；将全局智能模型返回至多个数据参与方，解决了现有的联邦学习采用同态加密导致的计算效率低、通信开销大、噪声积累的技术问题，达到了在不牺牲安全性的前提下，确保数据共享的高效率和可靠性的技术效果。技术研发人员：房玉东,黄玉钏,佘笑梅,李振平,蔡亚飞,张伟,孙世超,李文广,于卫欣,杨博杰,刘文懋,高翔受保护的技术使用者：应急管理部大数据中心技术研发日：技术公布日：2025/1/6