技术新讯 > 计算推算,计数设备的制造及其应用技术 > 结果生成方法、生成模型训练方法、装置及存储介质与流程  >  正文

结果生成方法、生成模型训练方法、装置及存储介质与流程

  • 国知局
  • 2024-09-19 14:39:57

本公开涉及计算机,尤其涉及搜索、生成模型。

背景技术:

1、生成式大模型在自然语言理解和生成能力等方面取得了显著的提升。这种进步不仅推动了人工智能技术的发展,也促使搜索系统经历了重构和升级。传统的搜索系统通过召回、粗排、精排和点调等过程,提供多条结果以满足目标对象需求。而当前的搜索系统引入检索增强生成(retrieval-augmented generation,rag),可以生成一条准确有效、结构清晰、内容丰富的回答。

技术实现思路

1、本公开提供了结果生成方法、生成模型训练方法、装置及存储介质。

2、根据本公开的一方面,提供了一种结果生成方法,包括:

3、获取输入请求对应的换请求;

4、根据该输入请求及其对应的该换请求,搜索得到参考结果;

5、根据该输入请求及其对应的该换请求,以及该参考结果,生成该输入请求对应的输出结果。

6、根据本公开的另一方面,提供了生成模型的训练方法,包括:

7、将训练样本的提示词输入需要调整的生成模型,得到预测答案;

8、根据该训练样本的期望答案和该预测答案,对该生成模型进行调整;

9、其中,该训练样本的提示词包括原请求、换请求、搜索结果和目标指令。

10、根据本公开的一方面,提供了一种结果生成装置,包括:

11、获取模块,用于获取输入请求对应的换请求;

12、搜索模块,用于根据该输入请求及其对应的该换请求,搜索得到参考结果;

13、生成模块,用于根据该输入请求及其对应的该换请求,以及该参考结果,生成该输入请求对应的输出结果。

14、根据本公开的一方面,提供了一种生成模型的训练装置,包括:

15、输入模块,用于将训练样本的提示词输入需要调整的生成模型,得到预测答案;

16、调整模块,用于根据该训练样本的期望答案和该预测答案,对该生成模型进行调整;

17、其中,该训练样本的提示词包括原请求、换请求、搜索结果和目标指令。

18、根据本公开的另一方面,提供了一种电子设备,包括:

19、至少一个处理器;以及

20、与该至少一个处理器通信连接的存储器;其中,

21、该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开实施例中任一的方法。

22、根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行根据本公开实施例中任一的方法。

23、根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开实施例中任一的方法。

24、根据本公开,根据输入请求,其对应的换请求以及搜索得到的参考结果,生成输出结果,可以提高生成结果与输入请求关联性,提高生成的结果的准确性。

25、应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。

技术特征:

1.一种结果生成方法,包括:

2.根据权利要求1所述的方法,其中,获取输入请求对应的换请求,包括:

3.根据权利要求1所述的方法,其中,根据所述输入请求及其对应的所述换请求,搜索得到参考结果,包括:

4.根据权利要求3所述的方法,其中,根据所述输入请求及其对应的所述换请求,得到多意图请求,包括:

5.根据权利要求3所述的方法,其中,根据所述输入请求及其对应的所述换请求,以及所述参考结果,生成所述输入请求对应的输出结果,包括:

6.根据权利要求1所述的方法,其中,生成模型的训练样本包括提示词和答案,所述提示词包括原请求、换请求、搜索结果和目标指令。

7.根据权利要求1所述的方法,其中,原请求和所述换请求是在换请求词典中采样得到。

8.根据权利要求1所述的方法,其中,所述方法还包括:

9.根据权利要求8所述的方法,其中,根据原请求的搜索意图对会话中所述原请求关联的多个换请求进行清洗,包括以下至少之一:

10.根据权利要求1至9中任一项所述的方法,其中,所述方法还包括:

11.根据权利要求1至10中任一项所述的方法,其中,所述方法还包括:

12.一种生成模型的训练方法,包括:

13.根据权利要求12所述的方法,其中,所述提示词的组装方式包括:

14.一种结果生成装置,包括:

15.根据权利要求14所述的装置,其中,所述获取模块,还用于在换请求词典中查找所述输入请求对应的换请求。

16.根据权利要求14所述的装置,其中,所述搜索模块,包括:

17.根据权利要求16所述的装置,其中,所述多意图请求获取子模块,还用于使用大语言模型对所述输入请求及其对应的所述换请求进行归纳处理,得到所述多意图请求。

18.根据权利要求16所述的装置,其中,所述生成模块,还用于将所述多意图请求和所述参考结果输入生成模型,得到所述输入请求对应的输出结果。

19.根据权利要求14所述的装置,其中,生成模型的训练样本包括提示词和答案,所述提示词包括原请求、换请求、搜索结果和目标指令。

20.根据权利要求14所述的装置,其中,原请求和所述换请求是在换请求词典中采样得到。

21.根据权利要求14所述的装置,其中,所述装置还包括:

22.根据权利要求21所述的装置,其中,所述清洗模块,还用于以下至少之一:

23.根据权利要求14至22中任一项所述的装置,其中,所述装置还包括:

24.根据权利要求14至23中任一项所述的装置,其中,所述装置还包括:

25.一种生成模型的训练装置,包括:

26.根据权利要求25所述的装置,其中,所述提示词的组装方式包括:

27.一种电子设备,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-11或权利要求12-13中任一项所述的方法。

28.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-11或权利要求12-13中任一项所述的方法。

29.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-11或权利要求12-13中任一项所述的方法。

技术总结本公开提供了结果生成方法、生成模型训练方法、装置及存储介质,涉及计算机技术领域,尤其涉及搜索技术领域、生成模型技术领域。具体实现方案为:获取输入请求对应的换请求;根据该输入请求及其对应的该换请求,搜索得到参考结果;根据该输入请求及其对应的该换请求,以及该参考结果,生成该输入请求对应的输出结果。根据本公开,根据输入请求,其对应的换请求以及搜索得到的参考结果,生成输出结果,可以提高生成结果与输入请求关联性,提高生成的结果的准确性。技术研发人员:鲁宇婧,夏乔林,王楷翔,王昊,史海波,辜斯缪受保护的技术使用者:百度时代网络技术(北京)有限公司技术研发日:技术公布日:2024/9/17

本文地址:https://www.jishuxx.com/zhuanli/20240919/299487.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。