技术新讯 > 计算推算,计数设备的制造及其应用技术 > 面向检索增强语言模型的知识冲突分析缓解方法  >  正文

面向检索增强语言模型的知识冲突分析缓解方法

  • 国知局
  • 2024-09-11 14:46:37

本发明涉及自然语言处理,尤其涉及一种面向检索增强语言模型的知识冲突分析缓解方法。

背景技术:

1、在信息技术的快速演进中,大型语言模型(large language model,llm)已经通过深度预训练过程,从海量预训练语料中提炼出丰富的事实性知识,进而构建起复杂的内部记忆体系,形成了内部记忆。这种内部记忆被编码在大型语言模型的结构参数中,使得大型语言模型能够基于以往见过的知识,进行文本生成与推理。然而,这种内部记忆可能并不总是准确或最新的,它的更新和实时性受限于预训练周期的约束,无法反映现实世界的动态变化。因此,当面对需要最新、实时信息的查询,例如询问“最新的诺贝尔物理学奖得主?”时,大型语言模型往往依赖于过时的内部记忆,从而导致不准确的输出。

2、面对此类挑战,检索增强语言模型的概念应运而生。检索增强语言模型在传统的大型语言模型架构上加入了信息检索的功能,能够动态地从外部数据源通过检索器提取信息,并与内部记忆相结合,以产生更为准确和时效的回答。检索增强语言模型不仅保留了大型语言模型在文本生成方面的强大能力,还通过外部信息的实时检索,极大地拓展了其应用边界和准确度。

3、然而,检索增强语言模型的这种新能力存在知识冲突的问题。这种知识冲突发生在检索增强语言模型从不同外部知识源中检索到的信息彼此矛盾,或与内部记忆不吻合时。举例来说,若一部分数据源指出x年某位科学家获得诺贝尔物理学奖,而另一部分数据源称x+1年另一位科学家赢得了该奖项,同时检索增强语言模型的内部记忆停留在x-2年的信息上,此时检索增强语言模型在面对知识冲突的情况,无法给出准确的回答。

技术实现思路

1、本发明提供一种面向检索增强语言模型的知识冲突分析缓解方法,用以解决检索增强语言模型在应用时产生的知识冲突的缺陷。

2、本发明提供一种面向检索增强语言模型的知识冲突分析缓解方法,包括:

3、获取问题样本、所述问题样本携带的模型内部记忆答案以及外部来源答案;

4、从外部知识源中检索所述问题样本的相关文档,并将所述问题样本以及所述相关文档输入至检索增强语言模型,得到所述检索增强语言模型的回复结果;

5、基于所述模型内部记忆答案、所述外部来源答案和所述回复结果,从所述回复结果的正确性、忠实性和模型记忆性中至少一个角度,对所述检索增强语言模型进行知识冲突分析,得到分析结果;

6、若所述分析结果为所述检索增强语言模型存在知识冲突,则基于所述问题样本及其对应于所述知识冲突的类型的答案样本,对所述检索增强语言模型进行训练,以缓解所述知识冲突。

7、根据本发明提供的一种面向检索增强语言模型的知识冲突分析缓解方法,所述基于所述问题样本及其对应于所述知识冲突的类型的答案样本,对所述检索增强语言模型进行训练,以缓解所述知识冲突,具体包括:

8、确定所述知识冲突的类型为模型内部记忆与外部知识源之间的第一冲突,则将所述问题样本输入至检索增强语言模型,得到所述检索增强语言模型的内部记忆预测结果,并将所述回复结果与所述内部记忆预测结果为所述答案样本,以最大化所述回复结果与所述内部记忆预测结果之间的差异为目标,对所述检索增强语言模型进行训练,以缓解所述第一冲突;

9、确定所述知识冲突的类型为外部知识源中真实知识与非真实知识之间的第二冲突,则确定所述问题样本在所述外部知识源中的非真实性答案,并将所述非真实性答案以及所述外部来源答案作为所述答案样本,以最大化所述非真实性答案与所述外部来源答案之间的差异为目标,对所述检索增强语言模型进行训练,以缓解所述第二冲突。

10、根据本发明提供的一种面向检索增强语言模型的知识冲突分析缓解方法,所述确定所述问题样本在所述外部知识源中的非真实性答案,具体包括:

11、基于业余语言模型,采用事实感知指令,生成所述问题样本在所述外部知识源中的非真实性答案;

12、其中,所述业余语言模型基于非真实性问答样本对进行训练得到。

13、根据本发明提供的一种面向检索增强语言模型的知识冲突分析缓解方法,所述基于所述模型内部记忆答案、所述外部来源答案和所述回复结果,从所述回复结果的正确性、忠实性和模型记忆性中至少一个角度,对所述检索增强语言模型进行知识冲突分析,得到分析结果,具体包括:

14、分别计算所述模型内部记忆答案与所述回复结果之间的第一差异,以及所述外部来源答案与所述回复结果之间的第二差异,并基于所述第一差异以及所述第二差异,从所述正确性的角度,对所述检索增强语言模型进行知识冲突分析。

15、根据本发明提供的一种面向检索增强语言模型的知识冲突分析缓解方法,所述基于所述模型内部记忆答案、所述外部来源答案和所述回复结果,从所述回复结果的正确性、忠实性和模型记忆性中至少一个角度,对所述检索增强语言模型进行知识冲突分析,得到分析结果,还具体包括:

16、基于所述外部知识源,判断所述回复结果是否参考外部知识源以及偏好的知识类型,得到第一判断结果;

17、基于所述第一判断结果,从所述忠实性的角度,对所述检索增强语言模型进行知识冲突分析。

18、根据本发明提供的一种面向检索增强语言模型的知识冲突分析缓解方法,所述基于所述模型内部记忆答案、所述外部来源答案和所述回复结果,从所述回复结果的正确性、忠实性和模型记忆性中至少一个角度,对所述检索增强语言模型进行知识冲突分析,得到分析结果,还具体包括:

19、基于所述外部知识源,判断所述回复结果是否坚持模型内部记忆,得到第二判断结果;

20、基于所述第二判断结果,从所述模型记忆性的角度,对所述检索增强语言模型进行知识冲突分析。

21、本发明还提供一种面向检索增强语言模型的知识冲突分析缓解装置,包括:

22、获取模块,用于获取问题样本、所述问题样本携带的模型内部记忆答案以及外部来源答案;

23、模型应用模块,用于从外部知识源中检索所述问题样本的相关文档,并将所述问题样本以及所述相关文档输入至检索增强语言模型,得到所述检索增强语言模型的回复结果;

24、冲突分析模块,用于基于所述模型内部记忆答案、所述外部来源答案和所述回复结果,从所述回复结果的正确性、忠实性和模型记忆性中至少一个角度,对所述检索增强语言模型进行知识冲突分析,得到分析结果;

25、冲突缓解模块,用于若所述分析结果为所述检索增强语言模型存在知识冲突,则基于所述问题样本及其对应于所述知识冲突的类型的答案样本,对所述检索增强语言模型进行训练,以缓解所述知识冲突。

26、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现如上述任一种所述的面向检索增强语言模型的知识冲突分析缓解方法。

27、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述的面向检索增强语言模型的知识冲突分析缓解方法。

28、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述的面向检索增强语言模型的知识冲突分析缓解方法。

29、本发明提供的面向检索增强语言模型的知识冲突分析缓解方法,利用模型内部记忆答案、外部来源答案和回复结果,从回复结果的正确性、忠实性和模型记忆性中至少一个角度,对检索增强语言模型进行知识冲突分析,得到分析结果,如此可以更加清晰的确定出检索增强语言模型存在的问题。进而,在分析结果是检索增强语言模型存在知识冲突的情况下,利用问题样本及其对应于知识冲突的类型的答案样本,对检索增强语言模型进行训练,以缓解检索增强语言模型的知识冲突问题,提高其平均召回率,更好地校准检索增强语言模型的置信度水平,以提高其在面对知识冲突时的决策质量,确保检索增强语言模型能够在面对复杂的信息时做出更加准确的判断。

本文地址:https://www.jishuxx.com/zhuanli/20240911/292112.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。