技术新讯 > 计算推算,计数设备的制造及其应用技术 > 图数据处理方法、装置、设备及计算机可读存储介质与流程  >  正文

图数据处理方法、装置、设备及计算机可读存储介质与流程

  • 国知局
  • 2024-08-22 14:45:57

本技术涉及知识图谱技术,尤其涉及一种图数据处理方法、装置、设备及计算机可读存储介质。

背景技术:

1、相关的关系推断方法主要涉及图上的机器学习技术,关系推断任务被建模为图网络上的二分类问题。是基于图网络的方法构建了一个社交网络,每个实体被构造成图节点,关系被构造成图中的边。图网络中都是连接的节点,如此能够利用图网络进行关系推断,也即利用图网络推断目前没有连接的节点在未来是否会连接。

2、但在实际应用场景中,图网络中的任一节点均需要与其它节点具有边连接,从而基于已有的边连接进行关系推理,应用场景过于局限,从而影响推理的适用范围及推理结果的准确性。

技术实现思路

1、本技术实施例提供一种图数据处理方法、装置、计算机设备、计算机程序产品及计算机可读存储介质,能够提高目标知识图谱的完整性,提升关系推理的效率和准确性。

2、本技术实施例的技术方案是这样实现的:

3、本技术实施例提供一种图数据处理方法,所述方法包括:

4、获取待预测对象集和多个参考对象的参考关系信息,所述待预测对象集中待预测对象包含孤立待预测对象和非孤立待预测对象,所述孤立待预测对象未包含于所述多个参考对象中,所述非孤立待预测对象包含于所述多个参考对象中,所述参考关系信息用于表征所述多个参考对象中至少两个参考对象间的关系;

5、对于非孤立待预测对象,根据所述非孤立待预测对象的参考关系信息,确定所述非孤立待预测对象的第一关系信息,其中,所述第一关系信息用于表征所述非孤立待预测对象与所述多个参考对象中除所述非孤立待预测对象外的其他的一个或多个参考对象间的关系;

6、对于孤立待预测对象,根据所述多个参考关系信息推理所述孤立待预测对象的第二关系信息,其中,所述第二关系信息用于表征所述孤立待预测对象与所述多个参考对象中一个或多个参考对象间的关系;

7、基于所述第一关系信息和所述第二关系信息,构建目标知识图谱;

8、利用所述目标知识图谱确定与所述待预测对象集中的待预测对象满足关系条件的目标对象,所述目标对象属于所述待预测对象集或所述多个参考对象。

9、本技术实施例提供一种图数据处理装置,所述装置包括:

10、第一获取模块,用于获取待预测对象集和多个参考对象的参考关系信息,所述待预测对象集中待预测对象包含孤立待预测对象和非孤立待预测对象,所述孤立待预测对象未包含于所述多个参考对象中,所述非孤立待预测对象包含于所述多个参考对象中,所述参考关系信息用于表征所述多个参考对象中至少两个参考对象间的关系;

11、第一确定模块,用于对于非孤立待预测对象,根据所述非孤立待预测对象的参考关系信息,确定所述非孤立待预测对象的第一关系信息,其中,所述第一关系信息用于表征所述非孤立待预测对象与所述多个参考对象中除所述非孤立待预测对象外的其他的一个或多个参考对象间的关系;

12、第二确定模块,用于对于孤立待预测对象,根据所述多个参考关系信息推理所述孤立待预测对象的第二关系信息,其中,所述第二关系信息用于表征所述孤立待预测对象与所述多个参考对象中一个或多个参考对象间的关系;

13、构建模块,用于基于所述第一关系信息和所述第二关系信息,构建目标知识图谱;

14、第三确定模块,用于利用所述目标知识图谱确定与所述待预测对象集中的待预测对象满足关系条件的目标对象,所述目标待预测对象属于所述待预测对象集或所述多个参考对象。

15、在一些实施例中,所述第二确定模块还用于:

16、从所述多个参考对象中确定所述孤立待预测对象的相似对象;

17、从所述多个参考关系信息中获取包含所述相似对象的第三关系信息;

18、基于所述第三关系信息确定所述孤立待预测对象的第二关系信息。

19、在一些实施例中,所述第二确定模块还用于:

20、获取所述第三关系信息对应的置信得分;

21、将置信得分高于第一得分阈值的第三关系信息,确定为所述孤立待预测对象的第二关系信息。

22、在一些实施例中,所述第二确定模块还用于:

23、获取所述孤立待预测对象的属性信息和各个参考对象的属性信息,所述属性信息包括行业信息、类别信息和地域信息中的至少一种;

24、从所述各个参考对象中确定出与所述孤立待预测对象的属性信息满足相似性条件的相似对象。

25、在一些实施例中,所述第一确定模块还用于:

26、获取各个非孤立待预测对象的参考关系信息对应的置信得分;

27、将置信得分高于第二得分阈值的非孤立待预测对象的参考关系信息,确定为所述非孤立待预测对象的第一关系信息。

28、在一些实施例中,所述第三确定模块还用于:

29、获取所述目标知识图谱包含的关系信息数量;

30、当所述关系信息数量超过数量阈值时,从所述目标知识图谱中确定所述待预测对象集的关联对象,其中,所述关联对象为与所述待测试对象集存在逻辑关系的对象;

31、从所述关联对象中,确定与所述待预测对象集中的待预测对象满足关系条件的目标对象。

32、在一些实施例中,所述第三确定模块还用于:

33、从所述目标知识图谱中确定出与所述待预测对象集满足关联条件的候选对象;

34、确定包含所述候选对象的候选关系信息;

35、从所述目标知识图谱中获取各个候选关系信息的置信得分;

36、将置信得分高于第三得分阈值的候选关系信息确定为选中关系信息;

37、将所述选中关系信息包含的对象确定为所述待预测对象集的关联对象。

38、在一些实施例中,所述第三确定模块还用于:

39、当所述关系信息数量小于或者等于所述数量阈值时,获取所述待预测对象的第一对象表示向量、其余待预测对象的第二对象表示向量和所述关系条件的关系表示向量,所述其余待预测对象为待预测对象集中除待预测对象之外的待预测对象;

40、对所述第一对象表示向量和所述关系条件的关系表示向量进行求和处理,得到和向量;

41、确定所述和向量与各个第二对象表示向量之间的向量距离;

42、将小于距离阈值的向量距离对应的对象,确定为与所述待预测对象满足关系条件的目标对象。

43、在一些实施例中,所述装置还包括:

44、第二获取模块,用于获取各个参考对象的初始对象表示向量和各个参考关系信息的初始关系表示向量;

45、训练模块,用于对所述初始对象表示向量和所述初始关系表示向量进行训练更新,得到各个参考对象更新后的对象表示向量和各个参考关系信息更新后的关系表示向量。

46、在一些实施例中,所述训练模块还用于:

47、获取正例样本集;

48、基于所述正例样本集确定负例样本集;

49、基于所述正例样本集中各个正例样本的第一距离和所述负例样本集中各个负例样本的第二距离构建损失函数;

50、基于所述损失函数对各个初始对象表示向量和各个初始关系表示向量进行训练更新,得到各个参考对象更新后的对象表示向量和各个参考关系信息更新后的关系表示向量。

51、在一些实施例中,所述训练模块还用于:

52、获取第i正例样本,其中,i=1,2,…,n,n为正例样本的总样本数;

53、将所述第i正例样本中的第i头对象替换为第一随机对象,得到第i负例样本,其中,所述第一随机对象与所述第i头对象为不同的对象;或者,

54、将所述第i正例样本中的第i尾对象替换为第二随机对象,得到所述第i负例样本,其中,所述第二随机对象与所述第i尾对象为不同的对象。

55、本技术实施例提供一种计算机设备,包括:

56、存储器,用于存储计算机可执行指令;

57、处理器,用于执行所述存储器中存储的计算机可执行指令时,实现本技术实施例提供的图数据处理方法。

58、本技术实施例提供一种计算机可读存储介质,存储有计算机可执行指令,用于引起被处理器执行时,实现本技术实施例提供的图数据处理方法。

59、本技术实施例提供一种计算机程序产品,包括计算机程序或计算机可执行指令,所述计算机程序或计算机可执行指令被处理器执行时,实现本技术实施例提供的图数据处理方法。

60、本技术实施例具有以下有益效果:

61、在本技术实施例中,针对待预测对象集中的非孤立待预测对象,是根据非孤立待预测对象的参考关系信息,确定非孤立待预测对象的第一关系信息,其中非孤立待预测对象包含于多个参考对象中;针对待预测对象集中的孤立待预测对象,是根据多个参考关系信息推理出孤立待预测对象的第二关系信息,其中孤立待预测对象未包含于多个参考对象中;接着,基于第一关系信息和第二关系信息来构建目标知识图谱,该目标知识图谱为待预测对象对应的知识图谱,并且该知识图谱中包含存在连接关系的孤立节点;最后利用目标知识图谱确定与待预测对象集中的待预测对象满足关系条件的目标对象,其中,该目标对象属于待预测对象集或者多个参考对象。如此能够构建包含孤立节点的目标知识图谱,且该孤立节点在目标知识图谱中存在关系信息,使得孤立节点不再“孤立”,促使孤立节点能够用于推理,提高目标知识图谱的完整性。此外,基于该完整的目标知识图谱能够提供更全面的关系信息,能够提升关系推理的效率以及准确性。

本文地址:https://www.jishuxx.com/zhuanli/20240822/279780.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。