技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种面向知识图谱实体嵌入层次关系的数据免疫方法及装置  >  正文

一种面向知识图谱实体嵌入层次关系的数据免疫方法及装置

  • 国知局
  • 2024-10-15 09:33:14

本发明属于网络安全的,具体涉及一种面向知识图谱实体嵌入层次关系的数据免疫方法及装置。

背景技术:

1、知识图谱kg(knowledge graph)是一种结构化的图形表示,用于描述现实世界中的实体、关系和事实,在人工智能、自然语言处理和数据挖掘等各个领域发挥着至关重要的作用。知识图谱通常由节点、边和三元组构成,其中节点表示事物实体,边表示事物实体之间的关系,形如(头实体,关系,尾实体)的三元组表示描述头尾实体间关系的事实。知识图谱是目前计算机科学研究的重要领域,知识图谱嵌入是知识图谱的一个重要分支,其目的是将知识图谱这种结构化的数据转化为高维向量,同时要保留知识图谱本身的语义和拓扑结构,从而方便知识图谱更好地为下游任务服务。随着知识图谱广泛地应用在语义搜索、推荐系统、对话系统等工业任务中,知识图谱嵌入任务受到研究者们的重视,而针对知识图谱嵌入任务的数据投毒也引起了研究者们的广泛关注。就攻击者而言,对知识图谱嵌入模型的数据投毒可以一定程度地降低知识图谱嵌入的准确性,达到破坏敌方知识图谱的目的;就使用者而言,研究知识图谱嵌入的数据投毒攻击有利于研究知识图谱嵌入的深层原理,进一步提高嵌入的准确率和鲁棒性。

2、目前,针对知识图谱嵌入的数据投毒攻击有很多方法,例如基于三元组梯度的攻击,基于知识图谱关系模式的攻击。层次关系被证明是知识数据中广泛存在的一种语义关系,近年来出现了具备表达层次语义的知识图谱嵌入模型,例如hake模型。

3、在inference attack中攻击者首先选定目标三元组作为攻击对象,同时也是产生毒化三元组的依据。inference attack给出了三种攻击策略。基于同义的攻击,基于反义的攻击和基于合成语义的攻击。例如基于同义的攻击中,三元组(a,朋友,b)作为目标三元组,攻击其中的a实体,则添加(c,朋友,b)这个虚构的三元组(毒化三元组),这导致在做链路预测(?,朋友,b)时,头实体(?)为a的概率就降低了。例如基于反义的攻击中,三元组(c,包括,d)作为目标三元组,攻击其中的c实体,则添加(d,包括,c)这个虚构的三元组,(c,包括,d)这个三元组的置信度下降。例如基于合成语义攻击中,(e,的老师是,f),则可以考虑添加(e,的儿子是,g),(g,的儿子是,f)这样(e,的老师是,f)的置信度则下降了。以上是理解性的解释,在实际操作中,inference attack为了确定毒化三元组,提出了三种计算方式,分别是计算软真分数(衡量三元组满足推理模式的标准,一个逻辑表达式为真的程度。同义和反义中,选择软真分数最低的实体组成毒化三元组,组合攻击中,利用k-means算法聚类所有可能的中间实体确定每个类别中ground truth分数最低的实体,在k个类别最低分中选择最低分的实体组成毒化三元组)、链路预测排名(选择链路预测任务排名比正确结果低一位的实体,组成诱饵三元组。模型很可能学到了一个信心很高的低分数)和余弦距离(模拟语义相似度,选择与链路预测结果最不类似的实体,就是余弦距离最大的实体,使用它组成毒化三元组)。构造出毒化数据以后,将数据添加至训练集中,则更新以后的模型目标三元组的嵌入准确率会有所下降。

技术实现思路

1、本发明的主要目的在于克服现有技术的缺点与不足,提供一种面向知识图谱实体嵌入层次关系的数据免疫方法及装置,通过利用知识图谱构造用于数据投毒攻击的毒化数据,首次提出了针对层次关系的攻击和攻击思路,一方面能够用于捕获攻击者的弱点并攻破攻击者,另一方面能够基于攻击者的攻击特点破坏目标模型的嵌入结果,达到干扰知识图谱嵌入应用效果的目的。

2、为了达到上述目的,本发明采用以下技术方案:

3、第一方面,本发明提供了一种面向知识图谱实体嵌入层次关系的数据免疫方法,包括下述步骤:

4、获取目标模型的层次信息,目标模型包括多个目标实体;

5、利用层次信息将第一层节点作为投毒树的根节点,将相邻节点作为投毒树的其他层,构建多个投毒树,获得森林;

6、选择目标实体,攻击者根据需要选择一个或者多个目标实体作为攻击目标;

7、根据目标实体在森林中的位置,攻击者按照层次攻击策略和攻击者意图构造毒化数据;

8、将毒化数据添加到数据集,更新目标模型,获取被毒化模型;

9、利用被毒化模型识别攻击者的攻击特征,并对攻击者采取攻击或者防御措施。

10、作为优选的技术方案,所述获取目标模型的层次信息,具体为:利用层次分类方法,将实体和关系映射在空间中,获取层次信息;

11、所述目标模型包括有独立层次信息模型、可表达层次信息模型和非独立层次信息模型。

12、作为优选的技术方案,所述将相邻节点作为投毒树的其他层,包括:

13、将根节点的相邻节点作为投毒树的第二层;

14、将第二层节点的相邻节点作为投毒树的第三层。

15、作为优选的技术方案,若被纳入第二层的节点已经出现在投毒树的根节点中,则忽略此节点;重复将节点作为投毒树的层,直到所有节点被纳入树结构中。

16、作为优选的技术方案,每个投毒树具有ni层,计算每个投毒树中的第i层位于获得的层次信息中的第i层的占比,判断投毒的可靠性。

17、作为优选的技术方案,所述层次攻击策略包括升层攻击,具体为:

18、将攻击实体设置在层次结构第ni层,选择在层次结构第ni-2层的目标实体;

19、计算ground truth分数,将最低ground truth分数的三元组作为毒化三元组。

20、作为优选的技术方案,所述层次攻击策略包括降层攻击,具体为:

21、将攻击实体设置在层次结构第ni层,选择层次结构第ni+2层的目标实体;

22、计算ground truth分数,将最低ground truth分数的三元组作为毒化三元组。

23、作为优选的技术方案,所述层次攻击策略包括反转攻击,具体为:

24、当攻击者的攻击目标为跨层次的三元组时,直接添加逆转原始层次结构的毒化三元组,通过不同标准确定新的关系,使得新构成的毒化三元组对原三元组影响最大。

25、作为优选的技术方案,所述层次攻击策略包括同层攻击,具体为:

26、在整个森林中ni-1或者ni+1层选择攻击实体;

27、选择在层次结构第ni层的目标实体;

28、计算ground truth分数,将最低ground truth分数的三元组作为毒化三元组。

29、第二方面,本发明还提供了一种面向知识图谱实体嵌入层次关系的数据免疫装置,应用于所述的面向知识图谱实体嵌入层次关系的数据免疫方法,包括信息获取模块、森林构建模块、目标选择模块、数据毒化模块、模型更新模块以及免疫防御模块;

30、信息获取模块,用于获取目标模型的层次信息;

31、森林构建模块,用于利用层次信息将第一层节点作为投毒树的根节点,将相邻节点作为投毒树的其他层,构建多个投毒树,获得森林;

32、目标选择模块,用于选择目标实体,攻击者根据需要选择一个或者多个目标实体作为攻击目标;

33、数据毒化模块,用于根据目标实体在森林中的位置,攻击者按照层次攻击策略和攻击者意图构造毒化数据;

34、模型更新模块,用于将毒化数据添加到数据集,更新目标模型,获取被毒化模型;

35、免疫防御模块,用于利用被毒化模型识别攻击者的攻击特征,并对攻击者采取攻击或者防御措施。

36、本发明与现有技术相比,具有如下优点和有益效果:

37、(1)本发明利用知识图谱的层次关系构建毒化树,能够提高知识图谱的数据筛查效率,提高知识图谱模型对层次关系更具有倾向性,从而提高模型的鲁棒性。

38、(2)本发明根据模型是否可以表达层次信息进行了合理划分,并依据不同的层次攻击策略和攻击意图构建新的构造毒化数据,从而能够分析获得知识图谱嵌入结果的层次信息,增强了对知识图谱嵌入层次结构的针对性。

本文地址:https://www.jishuxx.com/zhuanli/20241015/314547.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。