技术新讯 > 计算推算,计数设备的制造及其应用技术 > 为大语言模型适配提示词的方法及装置与流程  >  正文

为大语言模型适配提示词的方法及装置与流程

  • 国知局
  • 2024-07-31 23:23:44

本申请涉及大语言模型,尤其涉及一种为大语言模型适配提示词的方法及装置。

背景技术:

1、在人工智能的发展过程中,大语言模型已经成为了重要的基础技术,在自然语言处理任务中展现出了卓越的性能。然而,这些模型往往需要针对特定的任务适配合适的提示词,以便更好地适应不同的应用场景。提示词是一种简短的文本片段,用于引导模型生成特定的输出。对于一个特定的模型,可以通过精心设计的提示词获得良好的效果,但是当模型更换时,这些提示词往往失效,导致模型性能下降。目前提示词的适配过程缺乏通用性和自动化,需要大量的人工干预和试错,这不仅耗时耗力,而且效率低下。此外,不同语言模型的内部机制和参数差异导致了适配的复杂性,增加了适配工作的难度。

技术实现思路

1、有鉴于此,本申请实施例提供了一种为大语言模型适配提示词的方法、装置、电子设备及计算机可读存储介质,以解决现有技术中为大语言模型适配提示词效率低效果差的问题。

2、本申请实施例第一方面,提供了一种为大语言模型适配提示词的方法,包括:获取为第一大语言模型适配的提示词,从第一大语言模型的历史输入中确定出多个问题;将提示词和各个问题输入第一大语言模型,输出各个问题对应的多个第一结果,将提示词和各个问题输入第二大语言模型,输出各个问题对应的多个第二结果;基于各个问题对应的多个第一结果和多个第二结果,计算第一大语言模型和第二大语言模型的区分度;当区分度大于阈值,利用第一大语言模型对提示词进行压缩以及为提示词增加词汇解释内容;将压缩以及增加词汇解释内容后的提示词作为为第二大语言模型适配的提示词。

3、本申请实施例第二方面,提供了一种为大语言模型适配提示词的装置,包括:获取模块,被配置为获取为第一大语言模型适配的提示词,从第一大语言模型的历史输入中确定出多个问题;模型模块,被配置为将提示词和各个问题输入第一大语言模型,输出各个问题对应的多个第一结果,将提示词和各个问题输入第二大语言模型,输出各个问题对应的多个第二结果;计算模块,被配置为基于各个问题对应的多个第一结果和多个第二结果,计算第一大语言模型和第二大语言模型的区分度;处理模块,被配置为当区分度大于阈值,利用第一大语言模型对提示词进行压缩以及为提示词增加词汇解释内容;确定模块,被配置为将压缩以及增加词汇解释内容后的提示词作为为第二大语言模型适配的提示词。

4、本申请实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。

5、本申请实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。

6、本申请实施例与现有技术相比存在有益效果是:获取为第一大语言模型适配的提示词,从第一大语言模型的历史输入中确定出多个问题;将提示词和各个问题输入第一大语言模型,输出各个问题对应的多个第一结果,将提示词和各个问题输入第二大语言模型,输出各个问题对应的多个第二结果;基于各个问题对应的多个第一结果和多个第二结果,计算第一大语言模型和第二大语言模型的区分度;当区分度大于阈值,利用第一大语言模型对提示词进行压缩以及为提示词增加词汇解释内容;将压缩以及增加词汇解释内容后的提示词作为为第二大语言模型适配的提示词。采用上述技术手段,可以解决现有技术中为大语言模型适配提示词效率低效果差的问题,进而提高适配提示词的效率,提升提示词引导模型生成特定输出的效果。

技术特征:

1.一种为大语言模型适配提示词的方法,其特征在于,包括:

2.根据权利要求1所述方法,其特征在于,当所述区分度大于阈值,执行如下循环:

3.根据权利要求2所述方法,其特征在于,依据压缩以及增加所述词汇解释内容后的提示词更新所述区分度,包括:

4.根据权利要求1所述方法,其特征在于,当所述区分度大于阈值,执行如下循环:

5.根据权利要求1所述方法,其特征在于,当所述区分度大于阈值:

6.根据权利要求1所述方法,其特征在于,基于各个问题对应的多个第一结果和多个第二结果,计算所述第一大语言模型和所述第二大语言模型的所述区分度,包括:

7.根据权利要求1所述方法,其特征在于,利用所述第一大语言模型为所述提示词增加词汇解释内容,包括:

8.一种为大语言模型适配提示词的装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。

10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。

技术总结本申请提供了一种为大语言模型适配提示词的方法及装置。该方法包括:从第一大语言模型的历史输入中确定出多个问题;将提示词和各个问题输入第一大语言模型,输出各个问题对应的多个第一结果,将提示词和各个问题输入第二大语言模型,输出各个问题对应的多个第二结果;基于各个问题对应的多个第一结果和多个第二结果,计算第一大语言模型和第二大语言模型的区分度;当区分度大于阈值,利用第一大语言模型对提示词进行压缩以及为提示词增加词汇解释内容;将压缩以及增加词汇解释内容后的提示词作为为第二大语言模型适配的提示词。采用上述技术手段,解决现有技术中为大语言模型适配提示词效率低效果差的问题。技术研发人员:张献涛,暴筱,张猛,林小俊受保护的技术使用者:北京赛彼思智能科技有限公司技术研发日:技术公布日:2024/7/29

本文地址:https://www.jishuxx.com/zhuanli/20240730/197342.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。