技术新讯 > 计算推算,计数设备的制造及其应用技术 > 知识图谱推理模型训练方法、知识图谱推理方法及其装置与流程 > 正文

知识图谱推理模型训练方法、知识图谱推理方法及其装置与流程

国知局
2024-09-05 14:43:15

本公开总体来说涉及知识图谱推理领域，更具体地讲，涉及一种知识图谱推理模型训练方法、知识图谱推理方法及其装置。

背景技术：

1、随着信息网络技术的快速发展，各种信息网络数据内容呈现爆炸式增长的态势。这样的内容通常具有大规模、异质多元、组织结构松散的特点，给人们有效获取信息和知识提出了挑战。知识图谱(kg，knowledge graph)是语义网络的知识库，能够用可视化技术描述知识资源及其载体，并挖掘、分析、构建、绘制和显示知识及它们之间的相互联系。

2、知识图谱作为一种特殊的图形结构，包括实体(entity)和关系(relation)，实体作为结点，关系作为有向边。在知识图谱中，每个边可被表示为具有(头部实体，关系，尾部实体)这一形式的三元组(h，r，t)，以指示两个实体h(即，头部实体)和t(即，尾部实体)通过关系r连接，例如(newyork，islocatedin，usa)可表示newyork位于usa。

3、知识图谱推理(kgr，knowledge graph reasoning)旨在利用图中已有信息从现有事实(facts)推导未知的事实。随着图神经网络(gnn)的普及，现有技术能够采用基于gnn的知识图谱推理方法推理知识图谱。基于gnn的知识图谱推理方法的一个重要设计组件被称为传播路径，传播路径中包含每个传播步骤中涉及的一组实体。现有方法通常使用手动设计的传播路径，但忽略了实体与查询关系(query relation)之间的相关性。此外，现有方法通常在整个图的整个邻域内传播实体表征(也可称为向量表达)，使得任意两个节点所共享的邻居就会非常多，导致这两个节点的表征非常相似，很容易出现过平滑问题。并且，在查询实体周围的所有实体间进行实体表征传播，对邻居实体等价对待，忽略了局部邻居和查询关系间的语义关联，进而导致不可避免地引入过多不相关实体和事实，随着传播路径的加长，在传播路径中更靠后的传播步骤中涉及的实体数量将呈指数级增长，增加了知识图谱推理模型的学习难度且计算成本急剧增长。

4、因此，需要一种能够在保证查询准确度的同时还能够减少学习难度和计算成本，并提高推理效率的知识图谱推理模型。

技术实现思路

1、为了至少解决现有技术中的上述问题，本技术提供了一种知识图谱推理模型训练方法、知识图谱推理方法及其装置。

2、根据本发明的示例性实施例，提供了一种知识图谱推理方法，其特征在于，所述方法包括：获取待推理查询，其中，所述待推理查询包括查询实体和查询关系；将所述待推理查询输入到知识图谱推理模型，获得针对所述待推理查询的候选应答实体集合；在所述候选应答实体集合中确定与所述待推理查询对应的预测应答实体，其中，所述知识图谱推理模型用于基于知识图谱中的实体之间的语义相关性在知识图谱的实体集合中确定所述候选应答实体集合。

3、可选地，将所述待推理查询输入到知识图谱推理模型，获得针对所述待推理查询的候选应答实体集合，可包括：使用所述知识图谱推理模型，在知识图谱的实体集合中确定待推理查询在知识图谱推理模型的传播路径上的每个传播步骤处的传播实体集合；将所述传播路径上的最后传播步骤处的传播实体集合确定为针对所述待推理查询的候选应答实体集合，其中，所述每个传播步骤处的传播实体集合至少包括上一传播步骤处的传播实体集合。

4、可选地，所述知识图谱可以是通过对初始知识图谱中的每个结点添加一个指向自身的关系，并对所述初始知识图谱中的每一条边添加一个对应的呈现相反关系的边，使得所述初始知识图谱中的长度未超过预设长度的关系路径被增广到所述预设长度而获得的，其中，结点指示实体，边指示该边所连接的结点之间的关系并且为有向边，所述预设长度的值可与知识图谱推理模型的传播路径的传播步骤的数量相等。

5、可选地，使用所述知识图谱推理模型，在知识图谱的实体集合中确定待推理查询在知识图谱推理模型的传播路径上的每个传播步骤处的传播实体集合，可包括：针对当前传播步骤，在所述知识图谱的实体集合中获取上一传播步骤处的传播实体集合中的每个传播实体的邻居实体，将获取的新邻居实体确定为候选实体，获得候选实体集合；使用增量采样策略从候选实体集合中采样确定部分候选实体，并将采样确定的候选实体以及上一传播步骤处的传播实体集合中的传播实体确定为当前传播步骤处的传播实体集合。

6、可选地，使用增量采样策略从候选实体集合中采样确定部分候选实体，可包括：获取针对当前传播步骤的分布采样参数，并确定候选实体集合中的每个候选实体在当前传播步骤处的向量表达；基于分布采样参数以及每个候选实体的向量表达，确定候选实体集合中的每个候选实体与查询实体和查询关系之间的语义关联程度；基于所述语义关联程度在所述候选实体集合中确定将被包括在当前传播步骤处的传播实体集合中的候选实体。

7、可选地，所述候选实体集合中的每个候选实体在当前步骤处的向量表达可以是基于所述每个候选实体在所述上一传播步骤处的向量表达、所述上一传播步骤处的传播实体集合中与所述每个候选实体对应的传播实体在所述上一传播步骤处的向量表达、以及所述每个候选实体与所述对应传播实体之间的关系在当前传播步骤处的向量表达确定的。

8、可选地，在确定将被包括在当前传播步骤处的传播实体集合中的候选实体之后，可通过直通式估计器，基于概率因子更新所确定的候选实体的向量表达，其中，所述概率因子可以是基于分布采样参数以及候选实体的向量表达获得的用于确定候选实体与查询实体和查询关系之间的语义关联程度的概率分布的参数。

9、可选地，基于分布采样参数以及每个候选实体的向量表达，确定候选实体集合中的每个候选实体与查询实体和查询关系之间的语义关联程度，可包括：基于分布采样参数以及每个候选实体的向量表达，确定每个候选实体与查询实体和查询关系之间的语义关联程度的概率分布。基于所述语义关联程度在所述候选实体集合中确定将被包括在当前传播步骤处的传播实体集合中的候选实体，可包括：基于每个候选实体与查询实体和查询关系的语义关联程度的概率分布，在所述候选实体集合中选择预定数量的候选实体作为将被包括在当前传播步骤处的传播实体集合中的候选实体。

10、根据本发明的另一示例性实施例，提供了一种知识图谱推理模型训练方法，其特征在于，所述知识图谱推理模型训练方法包括至少一轮训练过程，任意一轮所述训练过程包括：在知识图谱的实体集合中确定训练查询样本在知识图谱推理模型的传播路径上的每个传播步骤处的传播实体集合，其中，训练查询样本包括目标查询实体和目标查询关系；在所述传播路径上的最后传播步骤处的传播实体集合中确定与目标查询实体和目标查询关系对应的候选应答实体；基于针对训练查询样本的真实应答实体和候选应答实体，确定知识图谱推理模型的模型损失；基于模型损失，调整知识图谱推理模型的模型参数，其中，所述每个传播步骤处的传播实体集合至少包括上一传播步骤处的传播实体集合。

11、可选地，所述知识图谱可以是通过对初始知识图谱中的每个结点添加一个指向自身的关系，并对所述初始知识图谱中的每一条边添加一个对应的呈现相反关系的边，使得所述初始知识图谱中的长度未超过预设长度的关系路径被增广到所述预设长度而获得的，其中，结点指示实体，边指示该边所连接的结点之间的关系并且为有向边，所述预设长度的值与知识图谱推理模型的传播路径的传播步骤的数量相等。

12、可选地，在知识图谱的实体集合中确定训练查询样本在知识图谱推理模型的传播路径上的每个传播步骤处的传播实体集合，可包括：针对当前传播步骤，在所述知识图谱的实体集合中获取上一传播步骤处的传播实体集合中的每个传播实体的邻居实体，将获取的新邻居实体确定为候选实体，获得候选实体集合；使用增量采样策略从候选实体集合中采样确定部分候选实体，并将采样确定的候选实体以及上一传播步骤处的传播实体集合中的传播实体确定为当前传播步骤处的传播实体集合。

13、可选地，使用增量采样策略从候选实体集合中采样确定部分候选实体，可包括：获取针对当前传播步骤的分布采样参数，并确定候选实体集合中的每个候选实体在当前传播步骤处的向量表达；基于分布采样参数以及每个候选实体的向量表达，确定候选实体集合中的每个候选实体与目标查询实体和目标查询关系之间的语义关联程度；基于所述语义关联程度在所述候选实体集合中确定将被包括在当前传播步骤处的传播实体集合中的候选实体，其中，所述模型参数包括每个传播步骤处的分布采样参数。

14、可选地，所述候选实体集合中的每个候选实体在当前步骤处的向量表达可以是基于所述每个候选实体在所述上一传播步骤处的向量表达、所述上一传播步骤处的传播实体集合中与所述每个候选实体对应的传播实体在所述上一传播步骤处的向量表达、以及所述每个候选实体与所述对应传播实体之间的关系在当前传播步骤处的向量表达确定的。

15、可选地，在确定将被包括在当前传播步骤处的传播实体集合中的候选实体之后，可通过直通式估计器，基于概率因子更新所确定的候选实体的向量表达，其中，所述概率因子是基于分布采样参数以及候选实体的向量表达获得的用于确定候选实体与目标查询实体和目标查询关系之间的语义关联程度的概率分布的参数。

16、可选地，基于分布采样参数以及每个候选实体的向量表达，确定候选实体集合中的每个候选实体与目标查询实体和目标查询关系之间的语义关联程度，可包括：基于分布采样参数以及每个候选实体的向量表达，确定每个候选实体与目标查询实体和目标查询关系之间的语义关联程度的概率分布。基于所述语义关联程度在所述候选实体集合中确定将被包括在当前传播步骤处的传播实体集合中的候选实体，可包括：基于每个候选实体与目标查询实体和目标查询关系的语义关联程度的概率分布，在所述候选实体集合中选择预定数量的候选实体作为将被包括在当前传播步骤处的传播实体集合中的候选实体。

17、根据本发明的另一示例性实施例，提供了一种知识图谱推理装置，其特征在于，所述装置包括：查询获取单元，被配置为获取待推理查询，其中，所述待推理查询包括查询实体和查询关系；推理单元，被配置为将所述待推理查询输入到知识图谱推理模型，获得针对所述待推理查询的候选应答实体集合；预测单元，被配置为在所述候选应答实体集合中确定与所述待推理查询对应的预测应答实体，其中，所述知识图谱推理模型用于基于知识图谱中的实体之间的语义相关性在知识图谱的实体集合中确定所述候选应答实体集合。

18、可选地，推理单元可被配置为使用所述知识图谱推理模型，在知识图谱的实体集合中确定待推理查询在知识图谱推理模型的传播路径上的每个传播步骤处的传播实体集合，并将所述传播路径上的最后传播步骤处的传播实体集合确定为针对所述待推理查询的候选应答实体集合，其中，所述每个传播步骤处的传播实体集合至少包括上一传播步骤处的传播实体集合。

19、可选地，所述知识图谱可以是通过对初始知识图谱中的每个结点添加一个指向自身的关系，并对所述初始知识图谱中的每一条边添加一个对应的呈现相反关系的边，使得所述初始知识图谱中的长度未超过预设长度的关系路径被增广到所述预设长度而获得的，其中，结点指示实体，边指示该边所连接的结点之间的关系并且为有向边，所述预设长度的值与知识图谱推理模型的传播路径的传播步骤的数量相等。

20、可选地，推理单元被可配置为通过以下操作确定待推理查询在知识图谱推理模型的传播路径上的每个传播步骤处的传播实体集合：针对当前传播步骤，在所述知识图谱的实体集合中获取上一传播步骤处的传播实体集合中的每个传播实体的邻居实体，将获取的新邻居实体确定为候选实体，获得候选实体集合；使用增量采样策略从候选实体集合中采样确定部分候选实体，并将采样确定的候选实体以及上一传播步骤处的传播实体集合中的传播实体确定为当前传播步骤处的传播实体集合。

21、可选地，推理单元可被配置为通过以下操作获得从候选实体集合中采样确定部分候选实体：获取针对当前传播步骤的分布采样参数，并确定候选实体集合中的每个候选实体在当前传播步骤处的向量表达；基于分布采样参数以及每个候选实体的向量表达，确定候选实体集合中的每个候选实体与查询实体和查询关系之间的语义关联程度；基于所述语义关联程度在所述候选实体集合中确定将被包括在当前传播步骤处的传播实体集合中的候选实体。

22、可选地，所述候选实体集合中的每个候选实体在当前步骤处的向量表达可以是基于所述每个候选实体在所述上一传播步骤处的向量表达、所述上一传播步骤处的传播实体集合中与所述每个候选实体对应的传播实体在所述上一传播步骤处的向量表达、以及所述每个候选实体与所述对应传播实体之间的关系在当前传播步骤处的向量表达确定的。

23、可选地，在确定将被包括在当前传播步骤处的传播实体集合中的候选实体之后，推理单元可通过直通式估计器，基于概率因子更新所确定的候选实体的向量表达，其中，所述概率因子可以是基于分布采样参数以及候选实体的向量表达获得的用于确定候选实体与查询实体和查询关系之间的语义关联程度的概率分布的参数。

24、可选地，推理单元可被配置为基于分布采样参数以及每个候选实体的向量表达，确定每个候选实体与查询实体和查询关系之间的语义关联程度的概率分布，并基于每个候选实体与查询实体和查询关系的语义关联程度的概率分布，在所述候选实体集合中选择预定数量的候选实体作为将被包括在当前传播步骤处的传播实体集合中的候选实体。

25、根据本发明的另一示例性实施例，提供了一种知识图谱推理模型训练装置，其特征在于，所述装置包括：样本获取单元，被配置为获取训练查询样本；训练单元，被配置为使用获取的训练查询样本，通过至少一轮训练过程对知识图谱推理模型进行训练，其中，任意一轮所述训练过程包括：在知识图谱的实体集合中确定训练查询样本在知识图谱推理模型的传播路径上的每个传播步骤处的传播实体集合，其中，训练查询样本包括目标查询实体和目标查询关系；在所述传播路径上的最后传播步骤处的传播实体集合中确定与目标查询实体和目标查询关系对应的候选应答实体；基于针对训练查询样本的真实应答实体和候选应答实体，确定知识图谱推理模型的模型损失；基于模型损失，调整知识图谱推理模型的模型参数，其中，所述每个传播步骤处的传播实体集合至少包括上一传播步骤处的传播实体集合。

26、可选地，所述知识图谱可以是通过对初始知识图谱中的每个结点添加一个指向自身的关系，并对所述初始知识图谱中的每一条边添加一个对应的呈现相反关系的边，使得所述初始知识图谱中的长度未超过预设长度的关系路径被增广到所述预设长度而获得的，其中，结点指示实体，边指示该边所连接的结点之间的关系并且为有向边，所述预设长度的值与知识图谱推理模型的传播路径的传播步骤的数量相等。

27、可选地，训练单元可被配置为通过以下操作确定训练查询样本在知识图谱推理模型的传播路径上的每个传播步骤处的传播实体集合：针对当前传播步骤，在所述知识图谱的实体集合中获取上一传播步骤处的传播实体集合中的每个传播实体的邻居实体，将获取的新邻居实体确定为候选实体，获得候选实体集合；使用增量采样策略从候选实体集合中采样确定部分候选实体，并将采样确定的候选实体以及上一传播步骤处的传播实体集合中的传播实体确定为当前传播步骤处的传播实体集合。

28、可选地，训练单元可被配置为通过以下操作从候选实体集合中采样确定部分候选实体：获取针对当前传播步骤的分布采样参数，并确定候选实体集合中的每个候选实体在当前传播步骤处的向量表达；基于分布采样参数以及每个候选实体的向量表达，确定候选实体集合中的每个候选实体与目标查询实体和目标查询关系之间的语义关联程度；基于所述语义关联程度在所述候选实体集合中确定将被包括在当前传播步骤处的传播实体集合中的候选实体，其中，所述模型参数包括每个传播步骤处的分布采样参数。

29、可选地，所述候选实体集合中的每个候选实体在当前步骤处的向量表达可以是基于所述每个候选实体在所述上一传播步骤处的向量表达、所述上一传播步骤处的传播实体集合中与所述每个候选实体对应的传播实体在所述上一传播步骤处的向量表达、以及所述每个候选实体与所述对应传播实体之间的关系在当前传播步骤处的向量表达确定的。

30、可选地，在确定将被包括在当前传播步骤处的传播实体集合中的候选实体之后，训练单元可通过直通式估计器，基于概率因子更新所确定的候选实体的向量表达，其中，所述概率因子可以是基于分布采样参数以及候选实体的向量表达获得的用于确定候选实体与目标查询实体和目标查询关系之间的语义关联程度的概率分布的参数。

31、可选地，训练单元可被配置为基于分布采样参数以及每个候选实体的向量表达，确定每个候选实体与目标查询实体和目标查询关系之间的语义关联程度的概率分布，，并基于每个候选实体与目标查询实体和目标查询关系的语义关联程度的概率分布，在所述候选实体集合中选择预定数量的候选实体作为将被包括在当前传播步骤处的传播实体集合中的候选实体。

32、根据本发明的另一示例性实施例，提供了一种包括至少一个计算装置和至少一个存储指令的存储装置的系统，其中，所述指令在被所述至少一个计算装置运行时，促使所述至少一个计算装置执行如前所述的知识图谱推理方法和/或知识图谱推理模型训练方法。

33、根据本发明的另一示例性实施例，提供了一种存储指令的计算机可读存储介质，其中，当所述指令被至少一个计算装置运行时，促使所述至少一个计算装置执行如前所述的知识图谱推理方法和/或知识图谱推理模型训练方法。

34、根据本发明的示例性实施例的知识图谱推理模型训练方法、知识图谱推理方法及其装置，可考虑针对不同的查询以及不同实体间的语义关系来选择传播路径上的各传播步骤所包括的实体，使得在最终获得相同数量的候选应答实体的情况下，有更大概率保持目标应答实体。

35、另一方面，根据本发明的示例性实施例的知识图谱推理模型训练方法、知识图谱推理方法及其装置，针对目标查询的传播路径在消息传播之前不再是给定和固定的，而是根据实体表达进行自适应调整并在每个传播步骤中动态更新，并且可在一次前向传播中，直接在最终传播步骤对候选目标应答实体进行评分，确定目标应答实体，由此进一步提高了知识图谱推理模型的模型效率。