技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种知识图谱增强的大模型多跳推理方法和系统与流程  >  正文

一种知识图谱增强的大模型多跳推理方法和系统与流程

  • 国知局
  • 2025-01-17 12:52:50

本申请涉及自然语言处理,具体涉及一种知识图谱增强的大模型多跳推理方法和系统。

背景技术:

1、大模型在处理复杂推理任务时通常面临一些挑战,主要包括幻觉现象和多跳推理问题。幻觉现象指的是模型生成不真实或不准确的内容,这是因为大模型生成的文本基于统计关联和模式识别,而不是基于真实世界的因果关系或逻辑推理。多跳推理指的是在回答复杂问题时需要跨越多个关联信息来进行推理和连接,大模型在这方面表现出困难,因为它们通常缺少有效的内在结构化推理机制。已有研究显示,基于文本数据的检索增强系统能够通过引入外部知识来减少大模型幻觉的产生。知识图谱以天然结构化的方式存储事实和关系,提供了一种简单且明确的实体关系框架。如何将知识图谱中明确的实体关系注入大模型,帮助大模型理解和推理问题中隐含的关系和逻辑链接,提升大模型复杂推理任务的完成能力,是本发明需要解决的关键问题。

技术实现思路

1、针对大模型推理问题,为有效减少大模型产生幻觉的现象,并提升大模型在解决复杂查询中的推理能力,本发明提出了一种知识图谱增强的大模型多跳推理方法和系统。

2、本发明的目的是通过以下技术方案来实现的:

3、本发明提供一种知识图谱增强的大模型多跳推理方法,包含以下步骤:

4、步骤1:基于给定的问题提取问题中的实体;

5、步骤2:基于步骤1得到的问题实体,从外部知识图谱中搜索以所有问题实体为起点的k_1跳路径知识p_1,同时搜索以所有问题实体对为起终点的长度不超过k_2的路径知识p_2,将得到的路径知识作为候选路径知识;

6、步骤3:基于步骤2得到的候选路径知识,将每条路径知识转化为文本字符串,使用相同的编码器计算给定问题和路径知识的嵌入向量并计算它们之间的相似性,保留n_1条相似度最高的p_1路径知识和n_2条相似度最高的p_2路径知识;

7、步骤4:基于步骤3得到的筛选后的路径知识,利用大模型聚合这些路径知识,得到全局知识;

8、步骤5:使用预定义的指令模板整合筛选后的路径知识和聚合得到的全局知识到提示词中,激发大模型基于外部知识提供所给问题的答案。

9、进一步地,所述步骤1包括:

10、将给定的问题输入实体命名识别算法或工具,将抽取得到的实体作为问题实体;或者将给定问题构建输入提示词“你是一名实体抽取的专家,从以下文本中抽取所有的实体,文本:q”;其中,是换行符,q是给定的问题,根据大模型的回答得到问题实体。

11、进一步地,所述步骤2包括:

12、基于步骤1得到的问题实体,利用广度优先搜索算法或者深度优先搜索算法,以每个问题实体作为起点,从外部知识图谱中搜索其k_1跳路径知识,检索完成后,得到路径知识p_1;同时,以所有问题实体对为起终点,搜索长度不超过k_2的路径知识,检索完成后,得到路径知识p_2;将得到的所有路径知识作为候选路径知识;其中,k_1和k_2均为预定义的超参数。

13、进一步地,所述步骤2进一步包括:

14、根据需要回答的问题,所使用的外部知识图谱包括通用知识图谱和针对特定领域构建的领域知识图谱;所述通用知识图谱包括wikidata kg、freebase和yago。

15、进一步地,所述步骤2进一步包括:

16、搜索路径知识时,若问题中的实体数量超过第一阈值且知识图谱的稠密程度超过第二阈值,则限制路径的长度或者只搜索与问题中的关键实体有关的路径;其中,路径的长度与问题的复杂程度呈正相关。

17、进一步地,所述步骤3包括:

18、基于步骤2得到的候选路径知识,将每条路径知识转化为文本字符串,通过连接头实体、关系和尾实体的方式来实现,使用相同的编码器计算给定问题和路径知识的嵌入向量并计算它们之间的相似性,相似性通过给定问题和路径知识的嵌入向量的内积计算得到,然后保留n_1条相似度最高的p_1路径知识和n_2条相似度最高的p_2路径知识,其中n_1和n_2均为预定义的超参数。

19、进一步地,所述步骤4包括:

20、基于步骤3得到的筛选后的路径知识,依靠大模型的推理和生成能力,以显示的方式聚合路径知识,以自然语言描述生成全局知识。

21、本发明还提供一种实现上述方法的知识图谱增强的大模型多跳推理系统,包括:

22、实体识别模块,用于识别所给问题中提到的实体;

23、路径知识搜索模块,用于搜索以问题实体为起点的多跳路径知识和以问题实体对为起终点的多跳路径知识;

24、过滤筛选模块,用于筛选与所给问题语义相似性高的候选路径知识;

25、路径知识聚合模块,用于聚合筛选得到的路径知识,形成全局知识;

26、知识注入模块,用于将路径知识和聚合的全局知识注入大模型,使得大模型基于外部知识提供所给问题的答案。

27、本发明还提供一种电子设备,包括存储器和处理器,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述的知识图谱增强的大模型多跳推理方法。

28、本发明还提供一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现上述的知识图谱增强的大模型多跳推理方法。

29、本发明的有益效果是:本发明提供了一种知识图谱增强的大模型多跳推理方法,为增强大模型在解决复杂查询中的推理能力,并有效减少大模型幻觉的产生提供了有效的解决方案。本发明通过引入外部知识图谱,在回答给定问题之前,通过以实体为中心的路径知识探索和基于语义的过滤筛选相关的局部知识,接着聚合局部知识得到隐藏的全局知识,最后将这些外部知识注入大模型,帮助大模型进行推理。本发明应用于大模型的推理时,显著提升了大模型的推理能力。

技术特征:

1.一种知识图谱增强的大模型多跳推理方法,其特征在于,包含以下步骤:

2.如权利要求1所述的知识图谱增强的大模型多跳推理方法,其特征在于,所述步骤1包括:

3.如权利要求1所述的知识图谱增强的大模型多跳推理方法,其特征在于,所述步骤2包括:

4.如权利要求1所述的知识图谱增强的大模型多跳推理方法,其特征在于,所述步骤2进一步包括:

5.如权利要求1所述的知识图谱增强的大模型多跳推理方法,其特征在于,所述步骤2进一步包括:

6.如权利要求1所述的知识图谱增强的大模型多跳推理方法,其特征在于,所述步骤3包括:

7.如权利要求1所述的知识图谱增强的大模型多跳推理方法,其特征在于,所述步骤4包括:

8.一种实现如权利要求1所述方法的知识图谱增强的大模型多跳推理系统,其特征在于,包括:

9.一种电子设备,包括存储器和处理器,其特征在于,所述存储器与所述处理器耦接;其中,所述存储器用于存储程序数据,所述处理器用于执行所述程序数据以实现上述权利要求1-7任一项所述的知识图谱增强的大模型多跳推理方法。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7任一项所述的知识图谱增强的大模型多跳推理方法。

技术总结本发明公开了一种知识图谱增强的大模型多跳推理方法和系统,根据需要回答的问题,从外部知识图谱中提取以实体为中心的路径知识,并整合注入到大模型的理解和推理过程中,增强了大模型在解决复杂问题中的推理能力,并减少了幻觉现象。首先,基于给定的问题提取问题中的实体;接着,从外部知识图谱中搜索以实体为起点的多跳路径知识和以实体对为起终点的限长路径知识;随后,使用编码器计算给定问题和路径知识的嵌入向量并计算它们之间的相似性,保留相似度最高的路径知识;再利用大模型聚合筛选后的路径知识,形成全局知识;最后,使用预定义的指令模板整合筛选后的路径知识和聚合得到的全局知识到提示词中,激发大模型生成基于提供知识的答案。技术研发人员:余磊,黄海梅,陈红阳,戚耀受保护的技术使用者:之江实验室技术研发日:技术公布日:2025/1/13

本文地址:https://www.jishuxx.com/zhuanli/20250117/355760.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。