技术新讯 > 计算推算,计数设备的制造及其应用技术 > 问答方法、装置、相关设备及计算机程序产品与流程  >  正文

问答方法、装置、相关设备及计算机程序产品与流程

  • 国知局
  • 2024-10-09 15:37:56

本申请涉及人工智能,更具体的说,是涉及一种问答方法、装置、相关设备及计算机程序产品。

背景技术:

1、随着人工智能技术的发展,人工智能模型越来越多的应用于各行各业,示例如智能问答场景。特别是伴随大模型的兴起,借助大模型强大的自然语义理解、逻辑推理及文本生成等能力,极大提升了各类型任务的处理效率。

2、当前,市面上各类型的大模型众多,不同大模型的网络结构、训练策略等均不相同,能力也不尽相同。单一的大模型性能有限,在一些问答场景下很容易生成错误的回答,因此如何提升大模型在智能问答场景下的效果成为亟待解决的问题。

技术实现思路

1、鉴于上述问题,提出了本申请以便提供一种问答方法、装置、相关设备及计算机程序产品,以实现提升大模型在智能问答场景下的效果的目的。具体方案如下:

2、本申请的第一方面,提供了一种问答方法,包括:

3、获取问题信息;

4、调用配置的大模型集合中各第一大模型,以指示每个所述第一大模型生成所述问题信息对应的回答内容,得到回答内容集合,所述大模型集合中包含两个以上不同的第一大模型;

5、调用配置的第二大模型,以指示所述第二大模型基于所述问题信息,判断所述回答内容集合中两两回答内容是否一致,得到所述回答内容集合中两两回答内容是否一致的判断结果;

6、若所述判断结果表示存在至少一对回答内容一致,则将一致的所述回答内容作为最终答案输出。

7、在一种可能的设计中,在本申请实施例的第一方面的另一种实现方式中,还包括:

8、若所述判断结果表示所述回答内容集合中各回答内容均不一致,则参考配置的所述大模型集合中各第一大模型的优势处理题型,选取优势处理题型包含所述问题信息的题型的第一大模型,作为目标第一大模型;

9、以所述目标第一大模型生成的所述问题信息对应的回答内容,作为最终答案输出。

10、在一种可能的设计中,在本申请实施例的第一方面的另一种实现方式中,调用配置的第二大模型得到所述回答内容集合中两两回答内容是否一致的判断结果的过程,包括:

11、持续检测各个所述第一大模型是否生成完毕回答内容,并在得到两个所述第一大模型生成的回答内容时开始对已生成的回答内容进行两两组合,并调用所述第二大模型,以指示第二大模型判断每一回答内容组合中两个回答内容是否一致,直至得到所述回答内容集合中两两回答内容是否一致的判断结果;

12、若所述判断结果表示存在至少一对回答内容一致,则将一致的所述回答内容作为最终答案输出的过程,包括:

13、持续检测所述第二大模型输出的判断结果,在首次检测到判断结果为一致时即将一致的所述回答内容作为最终答案输出。

14、在一种可能的设计中,在本申请实施例的第一方面的另一种实现方式中,还包括:

15、根据所述判断结果,确定并输出所述最终答案的风险等级,所述风险等级用于表征所述最终答案存在错误的风险大小。

16、在一种可能的设计中,在本申请实施例的第一方面的另一种实现方式中,还包括:

17、获取预先测试得到的所述目标第一大模型对所述问题信息的题型的正确率;

18、根据所述正确率确定并输出所述最终答案的风险等级,所述风险等级用于表征所述最终答案存在错误的风险大小。

19、在一种可能的设计中,在本申请实施例的第一方面的另一种实现方式中,根据所述判断结果,确定所述最终答案的风险等级的过程,包括:

20、根据所述判断结果中与所述最终答案一致的回答内容的数量,确定所述最终答案的风险等级,所述数量越多对应的风险等级所表征的最终答案存在错误的风险越小。

21、在一种可能的设计中,在本申请实施例的第一方面的另一种实现方式中,所述第二大模型为采用问答训练数据对通用大模型进行微调训练后得到的模型,其中,所述问答训练数据包括样本问题信息、与所述样本问题信息对应的回答内容对,以及所述回答内容对是否一致的判断结果。

22、在一种可能的设计中,在本申请实施例的第一方面的另一种实现方式中,还包括:

23、对所述回答内容集合中两两回答内容的一致性判断结果进行交叉验证,若确定存在验证不通过的回答内容,则标记所述验证不通过的回答内容,以作为训练数据用于对所述第二大模型进行更新训练。

24、本申请的第二方面,提供了一种问答装置,包括:

25、问题获取单元,用于获取问题信息;

26、第一大模型调用单元,用于调用配置的大模型集合中各第一大模型,以指示每个所述第一大模型生成所述问题信息对应的回答内容,得到回答内容集合,所述大模型集合中包含两个以上不同的第一大模型;

27、第二大模型调用单元,用于调用配置的第二大模型,以指示所述第二大模型基于所述问题信息,判断所述回答内容集合中两两回答内容是否一致,得到所述回答内容集合中两两回答内容是否一致的判断结果;

28、第一答案输出单元,用于若所述判断结果表示存在至少一对回答内容一致,则将一致的所述回答内容作为最终答案输出。

29、本申请的第三方面,提供了一种电子设备,包括:存储器和处理器;

30、所述存储器,用于存储程序;

31、所述处理器,用于执行所述程序,实现本申请前述第一方面中任一项所描述的问答方法。

32、本申请的第四方面,提供了一种可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时,实现本申请前述第一方面中任一项所描述的问答方法。

33、本申请的第五方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时,实现本申请前述第一方面中任一项所描述的问答方法。

34、借由上述技术方案,本申请集成了多个大模型进行问答处理,具体地,通过配置的大模型集合中各第一大模型,分别生成问题信息对应的回答内容,进一步,本申请还预先配置了第二大模型,该第二大模型用于对前述各第一大模型生成的回答内容进行一致性检测,得到回答内容集合中两两回答内容是否一致的判断结果,若判断结果表示存在至少一对回答内容一致,则可以将该一致的回答内容作为最终答案输出。考虑到单个大模型生成的回答内容可能存在错误,但是通过交叉验证任意两个大模型生成的回答内容的一致性,若存在至少一对回答内容一致,则该一致的回答内容的准确率将会极大的提升,因此可以将该一致的回答内容作为最终答案输出,能够极大提升回答结果的准确率。

35、此外,本申请在验证不同第一大模型生成的回答内容是否一致时,借助了第二大模型的能力,通过第二大模型结合问题信息这一上下文信息,对两两回答内容的一致性进行检测,可以充分利用第二大模型的推理能力,提高一致性检测的准确度。

技术特征:

1.一种问答方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,还包括:

3.根据权利要求1所述的方法,其特征在于,调用配置的第二大模型得到所述回答内容集合中两两回答内容是否一致的判断结果的过程,包括:

4.根据权利要求1所述的方法,其特征在于,还包括:

5.根据权利要求2所述的方法,其特征在于,还包括:

6.根据权利要求4所述的方法,其特征在于,根据所述判断结果,确定所述最终答案的风险等级的过程,包括:

7.根据权利要求1-6任一项所述的方法,其特征在于,所述第二大模型为采用问答训练数据对通用大模型进行微调训练后得到的模型,其中,所述问答训练数据包括样本问题信息、与所述样本问题信息对应的回答内容对,以及所述回答内容对是否一致的判断结果。

8.根据权利要求1-6任一项所述的方法,其特征在于,还包括:

9.一种问答装置,其特征在于,包括:

10.一种电子设备,其特征在于,包括:存储器和处理器;

11.一种可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时,实现如权利要求1~8中任一项所述的问答方法的各个步骤。

12.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时,实现如权利要求1~8中任一项所述的问答方法的各个步骤。

技术总结本申请公开了一种问答方法、装置、相关设备及计算机程序产品,本申请涉及人工智能技术领域,通过配置的大模型集合中各第一大模型,分别生成问题信息对应的回答内容,本申请还预先配置了第二大模型,充分利用第二大模型的推理能力,对前述各第一大模型生成的回答内容进行一致性检测,得到回答内容集合中两两回答内容是否一致的判断结果,若判断结果表示存在至少一对回答内容一致,则可以将该一致的回答内容作为最终答案输出。考虑到单个大模型存在误差,但是若存在至少一对回答内容一致,则该一致的回答内容的准确率将会极大的提升,因此可以将该一致的回答内容作为最终答案输出,能够极大提升回答结果的准确率。技术研发人员:刘金松,施扬,郑锐锋受保护的技术使用者:成都卓拙科技有限公司技术研发日:技术公布日:2024/9/29

本文地址:https://www.jishuxx.com/zhuanli/20241009/309405.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。