技术新讯 > 医药医疗技术的改进,医疗器械制造及应用技术 > 一种基于片段和声誉的去中心化联邦学习方法  >  正文

一种基于片段和声誉的去中心化联邦学习方法

  • 国知局
  • 2024-07-12 10:16:46

本发明属于联邦学习,具体涉及一种基于片段和声誉的去中心化联邦学习方法。

背景技术:

1、随着医学影像处理技术的进步和深度学习领域的快速发展,医疗行业越来越依赖于大规模的病理图片数据来训练更加精准和复杂的模型,以便对病理图片中的细节信息进行分析。然而,单个医疗机构拥有的病理数据量往往有限,这限制了模型训练的效果和精度。为了克服这一障碍并提升模型的性能,如今的趋势是多个医疗机构之间进行合作,共享病理图片数据以共同训练模型。这种跨机构的数据共享和模型训练过程中,数据隐私的保护至关重要。

2、为了在保护患者隐私的前提下实现数据的有效利用,可以通过联邦学习使作为参与者的各个医疗机构在本地训练自己的模型,然后仅与其他参与者共享模型参数而非敏感数据,从而在确保数据隐私的同时,共同训练出更加强大和准确的医学影像分析模型。

3、然而,联邦学习在上述应用场景中仍然存在多种安全风险,如:(1)投毒攻击,在联邦学习时,若医疗机构的模型训练过程被恶意控制,导致参与者上传的模型参数发生了变动,这将直接影响全局模型的准确性和可靠性,进而导致全局模型对病理图片中的细节信息做出错误判断,严重影响疾病诊断结果和治疗决策。(2)隐私攻击,如重构攻击,可能通过分析上传的模型来推测病人的病理图片,导致病人的敏感医疗信息从模型中被恢复。(3)中央服务器可能存在问题,在常见的设定中,中央服务器被假定为会忠实地执行既定的聚合操作,忽视了潜在的单点失败风险,因此,各参与方必须共同寻找一个受到所有参与者认可的第三方服务器,这个过程牵涉到复杂的协商和风险管理问题,另外,单点故障的风险也会导致医疗合作进程的中断。

4、针对上述风险,现有技术中还存在一种可以提供安全和隐私保护的联邦学习方法,该方法通过组合数据片段来保护模型的隐私。但是,这种方法在识别中毒梯度时,对基线的选择存在问题,导致对于朝不同方向但程度相同的梯度会做出同样的判断,并且模型的聚合算法主要关注于历史声誉的累积,而忽略了本轮评分的直接影响,影响了模型的最终精确度。

技术实现思路

1、为了解决现有技术中存在的上述问题,本发明提供了一种基于片段和声誉的去中心化联邦学习方法。本发明要解决的技术问题通过以下技术方案实现:

2、本发明提供一种基于片段和声誉的去中心化联邦学习方法,应用于通信连接的各个参与者,包括:

3、获取患者的病理图片;

4、将所述病理图片输入训练好的检测模型,利用该检测模型检测所述病理图片是否存在异常;其中,所述检测模型由参与者k按照如下步骤训练获得:

5、初始化自身持有的参与者声誉集合和待训练的本地模型,所述自身持有的参与者声誉集合包括参与者k持有的其他参与者的声誉,k=1,2,…,k,k表示参与者的数量;

6、基于本地的病理图片集对所述待训练的本地模型进行第t轮训练,得到第t轮训练后的当前本地模型,t=1,2,…,t,t表示预设训练轮次;

7、从所述当前本地模型的模型参数中提取出自身在第t轮训练后的待发送片段,将所述待发送片段发送至根据自身持有的其他参与者的声誉而选择出的片段接收者,并接收来自至少部分其他参与者的片段;

8、利用自身接收到的各个片段与所述当前本地模型的模型参数,确定完整模型的模型参数后,根据完整模型的模型参数的分数更新自身在第t轮训练后持有的参与者声誉集合

9、分别根据所述分数和所述参与者声誉集合计算第一信任向量μ、第二信任向量v;

10、根据所述第一信任向量μ和所述第二信任向量v,确定第t轮训练后的最终模型的模型参数,直至当前训练轮次达到预设训练轮次,得到训练完成的检测模型。

11、在本发明的一个实施例中,初始化自身持有的参与者声誉集合的步骤,包括:

12、将自身持有的参与者j的声誉初始化为0,得到初始化后的自身持有的参与者声誉集合表示参与者k初始化得到的自身持有的参与者声誉集合,表示参与者k初始化得到的自身持有的参与者j的声誉,j=1,2,…,k且k≠j。

13、在本发明的一个实施例中,基于本地的病理图片集对所述待训练的本地模型进行第t轮训练,得到第t轮训练后的当前本地模型的步骤之前,还包括:

14、计算用于片段提取的掩码矩阵m;

15、所述计算用于片段提取的掩码矩阵m的步骤,包括:

16、生成随机正态分布矩阵temp;

17、将所述随机正态分布矩阵temp中大于等于预设阈值的元素置为1,将所述随机正态分布矩阵temp中小于预设阈值的元素置为0后,获得掩码矩阵m。

18、在本发明的一个实施例中,所述病理图片集包括多个病理图片样本,参与者包括:随机选取的恶意参与者以及除恶意参与者之外的善意参与者;所述恶意参与者随机选取本地的病理图片样本发动标签翻转攻击或向第t轮训练后的当前本地模型发动高斯噪音攻击;

19、基于本地的病理图片集对所述待训练的本地模型进行第t轮训练,得到第t轮训练后的当前本地模型的步骤,包括:

20、令当前训练周期e=1;

21、将第t-1轮训练后得到的最终模型作为当前子模型,将预设数量的病理图片样本输入至所述当前子模型;

22、根据病理图片样本的标签和所述当前子模型的输出,计算预设损失函数的损失值后,基于该损失值进行反向传播以调整当前子模型的模型参数;

23、判断是否满足e是否小于等于预设训练周期e;若是,则令e=e+1,并返回将预设数量的病理图片样本输入至所述当前子模型的步骤;反之,则得到第t轮训练后的当前本地模型;

24、当自身为恶意参与者且发动标签翻转攻击时,将预设数量的病理图片样本输入至所述当前子模型的步骤之前,还包括:

25、从预设数量的病理图片样本中随机选取部分病理图片样本进行标签翻转;

26、当自身为恶意参与者且发动高斯噪音攻击时,基于本地的病理图片集对所述待训练的本地模型进行第t轮训练,得到第t轮训练后的当前本地模型的步骤之后,还包括:

27、向所述第t轮训练后的当前本地模型中添加高斯噪音。

28、在本发明的一个实施例中,从所述当前本地模型的模型参数中提取出自身在第t轮训练后的待发送片段的步骤,包括:

29、当自身为善意参与者时,将所述掩码矩阵m与自身在第t轮训练后的当前本地模型的模型参数相乘,得到自身在第t轮训练后的待发送片段

30、当自身为恶意参与者且发动高斯噪音攻击时,将所述掩码矩阵m与自身在第t轮训练后的添加高斯噪音攻击的当前本地模型的模型参数相乘,得到自身在第t轮训练后的待发送片段

31、得到自身在第t轮训练后的待发送片段的步骤之后,还包括:

32、按照如下公式更新所述掩码矩阵m:

33、m=1-m。

34、在本发明的一个实施例中,将所述待发送片段发送至根据自身持有的其他参与者的声誉而选择出的片段接收者,并接收来自部分其他参与者的片段的步骤,包括:

35、获取自身在第t-1轮训练后持有的参与者声誉集合并初始化片段接收者集合ssend=[],所述参与者声誉集合包括自身在第t-1轮训练后持有的参与者j的声誉

36、遍历其他参与者j,当自身持有的参与者j的声誉大于等于所述参与者声誉集合的第一四分位数时,将参与者j加入片段接收者集合ssend;

37、将所述第t轮训练后的待发送片段发送至片段接收者集合ssend中的各位片段接收者j1,并接收来自参与者j2的片段,k≠j2。

38、在本发明的一个实施例中,利用自身接收到的各个片段与所述当前本地模型的模型参数,确定完整模型的模型参数后,根据完整模型的模型参数的分数更新自身在第t轮训练后持有的参与者声誉集合的步骤,包括:

39、初始化基于所述各个片断与模型参数所生成完整模型的模型参数集合(τt)'=[];

40、初始化自身接收片段所属参与者集合srecv=[],自身接收片段所属参与者集合srecv用于存储第t轮训练后向参与者k发送片段的参与者j2;

41、获取来自参与者j2的片段将片段中等于0的元素置为1、不等于0的元素置为0后,生成矩阵temp_m;

42、根据所述片段所述模型参数和所述矩阵temp_m,计算自身基于模型参数和片段生成的完整模型的模型参数

43、

44、将模型参数加入完整模型的模型参数集合(τt)',

45、根据模型参数集合(τt)'中各模型参数的分数更新第t轮训练后持有的自身接收片段所属参与者集合srecv中每位参与者j2的声誉:

46、

47、式中,表示第t-1轮训练后自身持有的参与者j2的声誉,q1score表示分数的第一四分位数。

48、在本发明的一个实施例中,按照如下步骤计算模型参数集合(τt)'中各模型参数的分数

49、计算模型参数集合(τt)'中各模型参数的梯度:

50、

51、式中,η表示预设的学习率;

52、确定模型参数集合(τt)'中各模型参数的梯度中值

53、将所述各模型参数的梯度中与所述梯度中值具有最低余弦相似性的梯度确定为目标攻击时的基线

54、计算模型参数集合(τt)'中各模型参数的梯度与基线之间的距离

55、

56、式中,||·||表示取模;

57、从所述模型参数集合(τt)'中获取地t轮训练后得到的各完整模型的输出层l的参数;

58、计算所述各完整模型的输出层l的参数梯度

59、确定所述各完整模型的输出层l的参数的梯度中值

60、将所述各完整模型的输出层l的参数梯度中与所述梯度中值具有最低余弦相似性的梯度确定为非目标攻击时的基线

61、计算所述各完整模型的输出层l的参数梯度与基线之间的余弦相似度

62、将所述距离所述余弦相似度归一化至[0,1]内,得到归一化后的距离和归一化后的余弦相似度

63、根据归一化后的距离和归一化后的余弦相似度计算分数

64、

65、式中,α表示注意力集中在无目标攻击的比例。

66、在本发明的一个实施例中,基于本地的病理图片集对所述待训练的本地模型进行第t轮训练,得到第t轮训练后的当前本地模型的步骤,包括:

67、令当前训练周期e=1;

68、将第t-1轮训练后得到的最终模型作为当前子模型,将预设数量的病理图片样本输入至所述当前子模型;

69、根据病理图片样本的标签和所述当前子模型的输出,计算预设损失函数的损失值后,基于该损失值进行反向传播以调整当前子模型的模型参数;

70、判断是否满足e是否小于等于预设训练周期e;若是,则令e=e+1,并返回将预设数量的病理图片样本输入至所述当前子模型的步骤;反之,则得到第t轮训练后的当前本地模型。

71、在本发明的一个实施例中,分别根据所述分数和所述参与者声誉集合计算第一信任向量μ、第二信任向量v的步骤,包括:

72、根据所述完整模型的分数及其第一四分位数q1score,计算第一信任向量μ:

73、

74、根据自身在第t轮训练后持有的参与者声誉集合及其第一四分位数计算第二信任向量v:

75、

76、按照如下公式确定第t轮训练后的最终模型的模型参数:

77、

78、式中,fractiona、fractionb分别表示预设的集中在当前训练轮次更新分数的注意力以及集中在参与者声誉的注意力,(τt)′表示完整模型的模型参数集合。

79、与现有技术相比,本发明的有益效果在于:

80、(1)本发明提供了一种基于片段的去中心化联邦学习方法,利用联邦学习算法训练检测模型时采用了无服务器架构,每个参与者从当前本地模型的模型参数中提取出自身在第t轮训练后的待发送片段并发送至片段接收者,待发送片段中不包含当前本地模型的全部信息,而这些信息是进行隐私攻击的关键。参与者通过将收到的片段与当前本地模型结合可构建出完整模型,这意味着片段之外部分的质量完全取决于参与者自己,不涉及任何其他不可控因素。因此,生成的完整模型可以直接与接收到的片段所涉及的参与者关联起来。这一点对于防御投毒攻击尤为重要,不仅有利于在当前轮次中识别出被篡改的模型,也便于在后续轮次的模型评估中考虑到之前的评估结果,提增强了针对潜在威胁的防御能力。

81、(2)本发明使用余弦相似性来识别中毒模型,有效地保证了对各类别数据贡献的全面考虑,通过选择与梯度中值差异最大的梯度作为中毒基线,避免了对不同方向但相同程度的梯度产生相同的判断,从而提高了识别中毒模型的准确性和效率。

82、(3)现有技术中,由于在优化聚合模型时过分依赖参与者的历史声誉,容易忽略其在当前轮次中的表现,进而导致评估偏差。因此,为了更准确地评价参与者的贡献并优化模型的质量,本发明将关注度的计算分解为两个部分:fractiona和fractionb,二者之和为1,其中,fractiona专注于评估当前轮次的得分,直接反映参与者在本轮中的表现,目的是确保当前的贡献得到重视,从而激励参与者在每一轮中都尽力表现,fractionb关注于参与者的历史声誉,这一部分强调了稳定性和长期表现,确保了历史上表现良好的参与者在评估中得到认可。并且由于更新声誉时仅限于本轮向自身发送片段的参与者,这也激励参与者每轮都参与训练并上传高质量片段。通过调整fractiona和fractionb的比例,可以灵活地控制当前轮次得分与历史参与者声誉对模型聚合的影响,从而在两者之间找到平衡点,提高聚合模型的质量。

83、以下将结合附图及实施例对本发明做进一步详细说明。

本文地址:https://www.jishuxx.com/zhuanli/20240615/85885.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。