一种大模型指令生成方法、装置、电子设备及存储介质与流程
- 国知局
- 2024-08-05 11:56:59
本发明涉及人工智能,具体而言,涉及一种大模型指令生成方法、装置、电子设备及存储介质。
背景技术:
1、大语言模型(large language models),也称大模型,其能够理解和生成自然语言文本,实现文本分类、问答和对话等功能,在自然语言处理中的应用越来越广泛,例如在智能汽车上部署大模型,可用于为消费者提供更加智能化的服务。其中,大模型答案的生成与指令存在较大的关系,因此,指令的生成质量尤为重要。
2、尽管大模型中的指令已经具备较高的准确性,但是现有的大模型指令较为单一,通常为固定格式,例如“请回答以下问题”,导致模型针对指令生成的答案内容较为单一。为了提高大模型指令的多样性,相关技术引入人工智能来生成大模型指令,例如将原有指令输入人工智能模型以生成新的指令,这种方法虽然提高了大模型指令的多样性,但是生成的大模型指令的质量参差不齐,存在生成的新的大模型指令改变指令的原有含义的情况,例如原指令为“请详细回答以下问题”,而人工智能模型生成的新指令为“请简单回答以下问题”,导致大模型对指令含义的理解出现偏差,进而影响大模型生成答案的质量。
技术实现思路
1、本发明解决的问题是如何保证大模型中指令质量的情况下,提高指令的多样性。
2、为解决上述问题,本发明提供一种大模型指令生成方法、装置、电子设备及存储介质。
3、第一方面,本发明提供一种大模型指令生成方法,包括:
4、将已获取的至少一个目标关键词带入预设的基础指令生成模板,生成初始指令,其中,所述基础指令生成模板包括缺少关键词的问句;
5、根据预设的指令演化模板对所述初始指令进行至少一个方向的演化,获得多个演化后的指令;
6、对所有所述演化后的指令中不符合规范的指令进行过滤,获得目标指令,其中,所述不符合规范的指令包括指令含义偏离所述初始指令的原始含义的指令。
7、本发明中,首先根据获取的至少一个目标关键词和预设的基础指令生成模板生成初始指令,而后根据预设的指令演化模板对初始指令进行至少一个方向的演化,以获得多个演化后的指令,最后对所有演化后的指令中指令含义偏离初始指令的原始含义的指令进行过滤,获得目标指令。相比于现有技术,通过目标关键词和预设基础指令生成初始指令,为后续指令演化提供基础,利用指令演化模板对初始指令进行演化,生成不同方向的多个指令,增加了生成指令的多样性,根据规范对演化的指令进行过滤,对演化指令的生成质量进行把控,确保生成目标指令符合初始指令的含义。本发明的大模型指令生成方法,可实现在保证大模型中指令质量的情况下,提高指令的多样性。
8、可选地,在所述将已获取的至少一个目标关键词带入预设的基础指令生成模板之前,还包括:
9、从词袋集合的词袋中随机抽取至少一个所述目标关键词,所述词袋集合包括第一词袋、第二词袋、第三词袋和第四词袋中的至少一者,所述第一词袋包括表示大模型不同处理能力的多个关键词,所述第二词袋包括不同问答场景对应的多个关键词,所述第三词袋包括不同问答领域对应的多个关键词,所述第四词袋包括不同提问角色对应的多个关键词。
10、可选地,所述根据预设的指令演化模板对所述初始指令进行至少一个方向的演化,获得多个演化后的指令包括:
11、执行演化步骤,所述演化步骤包括基于所述指令演化模板对所述初始指令进行至少一个方向的演化,得到至少一个所述演化后的指令,其中,所述指令演化模板包括深化、实例化、原理化、具体化和变异化中的至少一个演化方向;
12、重复执行所述演化步骤多次,获得多个所述演化后的指令。
13、可选地,所述对所有所述演化后的指令中不符合规范的指令进行过滤包括:
14、对偏离所述初始指令的含义的所述演化后的指令进行过滤,得到第一指令集合;
15、过滤所述第一指令集合中不符合预设的逻辑模板和/或语法模板的所述演化后的指令,得到第二指令集合;
16、根据基于模型构建的判别器对所述第二指令集合中的各个所述演化后的指令以进行过滤,得到所述目标指令。
17、可选地,所述对偏离所述初始指令的含义的所述演化后的指令进行过滤,得到第一指令集合包括:
18、确定各个所述演化后的指令与所述初始指令之间的相似度;
19、过滤所有所述演化后的指令中所述相似度大于预设相似度阈值的指令,得到所述第一指令集合。
20、可选地,所述过滤所述第一指令集合中不符合预设的逻辑模板和/或语法模板的所述演化后的指令,得到第二指令集合包括:
21、将过滤后得到的所述演化后的指令组成第一指令集合,利用预设的正则模板对所述第一指令集合中的各个所述演化后的指令进行逻辑检测和/或语法检测;
22、根据检测结果过滤掉所述第一指令集合中第一不合规的指令,获得所述第二指令集合,其中,所述第一不合规的指令包括存在逻辑错误的指令和/或存在语法错误的指令,所述正则模版包括逻辑正确模板和/或语法正确模板。
23、可选地,所述根据基于模型构建的判别器对所述第二指令集合中的各个所述演化后的指令以进行过滤,得到所述目标指令包括:
24、利用所述判定器对所述第二指令集合中的各个所述演化后的指令进行质量检测;
25、根据检测结果过滤掉所述第二指令结合中第二不合规的指令,获得所述目标指令,其中,所述第二不合规的指令包括存在逻辑错误的指令和存在语法错误的指令。
26、第二方面,本发明提供一种大模型指令生成装置,包括:
27、生成模块,用于将已获取的至少一个目标关键词带入预设的基础指令生成模板,生成初始指令,其中,所述基础指令生成模板包括缺少关键词的问句;
28、演化模块,用于根据预设的指令演化模板对所述初始指令进行至少一个方向的演化,获得多个演化后的指令;
29、处理模块,用于对所有所述演化后的指令中不符合规范的指令进行过滤,获得目标指令,其中,所述不符合规范的指令包括指令含义偏离所述初始指令的原始含义的指令。
30、本发明提供的大模型指令生成装置与上述大模型指令生成方法能够产生的技术效果基本相同,在此不再赘述。
31、第三方面,本发明还提供一种电子设备,包括存储器和处理器;
32、所述存储器,用于存储计算机程序;
33、所述处理器,用于当执行所述计算机程序时,实现如上述所述的大模型指令生成方法。
34、本发明提供的电子设备与上述大模型指令生成方法能够产生的技术效果基本相同,在此不再赘述。
35、第四方面,本发明还提供一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如上述所述的大模型指令生成方法。
36、本发明提供的存储介质与上述大模型指令生成方法能够产生的技术效果基本相同,在此不再赘述。
技术特征:1.一种大模型指令生成方法,其特征在于,包括:
2.根据权利要求1所述的大模型指令生成方法,其特征在于,在所述将已获取的至少一个目标关键词带入预设的基础指令生成模板之前,还包括:
3.根据权利要求1所述的大模型指令生成方法,其特征在于,所述根据预设的指令演化模板对所述初始指令进行至少一个方向的演化,获得多个演化后的指令包括:
4.根据权利要求1所述的大模型指令生成方法,其特征在于,所述对所有所述演化后的指令中不符合规范的指令进行过滤包括:
5.根据权利要求4所述的大模型指令生成方法,其特征在于,所述对偏离所述初始指令的含义的所述演化后的指令进行过滤,得到第一指令集合包括:
6.根据权利要求4所述的大模型指令生成方法,其特征在于,所述过滤所述第一指令集合中不符合预设的逻辑模板和/或语法模板的所述演化后的指令,得到第二指令集合包括:
7.根据权利要求4所述的大模型指令生成方法,其特征在于,所述根据预设的基于模型构建的判别器对所述第二指令集合中的各个所述演化后的指令以进行过滤,得到所述目标指令包括:
8.一种大模型指令生成装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括存储器和处理器;
10.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1至7任一项所述的大模型指令生成方法。
技术总结本发明提供了一种大模型指令生成方法、装置、电子设备及存储介质,涉及人工智能技术领域。该方法包括:将已获取的至少一个目标关键词带入预设的基础指令生成模板,生成初始指令;根据预设的指令演化模板对初始指令进行至少一个方向的演化,获得多个演化后的指令;对所有演化后的指令中不符合规范的指令进行过滤,获得目标指令。相比于现有技术,本发明通过随机的目标关键词和预设基础指令生成初始指令,利用指令演化模板对初始指令进行演化,生成不同方向的指令,根据规范对演化的指令进行过滤,对演化指令的生成质量进行把控,在保证大语言模型中指令质量的情况下,提高了指令的多样性。技术研发人员:张龙图,刘家伟,陈思颢受保护的技术使用者:浙江吉利控股集团有限公司技术研发日:技术公布日:2024/8/1本文地址:https://www.jishuxx.com/zhuanli/20240802/260243.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表