技术新讯 > 计算推算,计数设备的制造及其应用技术 > 微调指令的构造方法、装置、设备及介质与流程  >  正文

微调指令的构造方法、装置、设备及介质与流程

  • 国知局
  • 2024-10-15 09:27:03

本公开涉及计算机,尤其涉及一种微调指令的构造方法、装置、设备及介质。

背景技术:

1、在自然语言处理(natural language processing,nlp)的领域内,采用先预训练再微调的策略已经成为近年来极为盛行的训练模式。预训练阶段本质上是一种无监督学习方法,它通过大量文本数据,使模型得以吸收和学习丰富的知识体系。

2、随后,通过有监督学习的微调技术(fine-tuning),可以针对特定的下游任务对模型进行优化。这种方法的核心在于,利用已经在预训练阶段掌握广泛语义表示的语言模型的基础上,继续对特定任务进行训练,而非从头开始重新训练一个新的模型。

3、由于预训练阶段已经为模型奠定了坚实的知识基础,这种方法能够有效地将预训练中获得的知识迁移到下游任务中,从而显著提升任务执行的效果。此外,精心设计的微调指令能够更加贴合预训练数据的特性,为模型指明通往任务目标的高效路径。

4、因此,在这一过程中,微调指令的设计显得尤为关键,它直接关系到模型是否能够充分利用预训练阶段所学习到的知识,以及是否能够在特定任务上实现性能的最大化。

技术实现思路

1、为了解决上述技术问题,本公开提供了一种微调指令的构造方法、装置、设备及介质。

2、根据本公开的一方面,提供了一种微调指令的构造方法,包括:

3、将负面文本样本的标签划分为多个级别的目标分类标签;

4、基于所述目标分类标签,使用预设的大模型对所述负面文本样本构造初始微调指令数据;所述初始微调指令数据用于表示所述负面文本样本的以下至少一项信息:所述负面文本样本关联的关键字、所述负面文本样本的分类类别和所述负面文本样本分类的原因分析;

5、在检查待微调的目标模型无法遵循所述初始微调指令数据的情况下,将所述初始微调指令数据修改为目标微调指令数据。

6、根据本公开的另一方面,提供了一种微调指令的构造装置,包括:

7、分类模块,用于将负面文本样本的标签划分为多个级别的目标分类标签;

8、指令构造模块,用于基于所述目标分类标签,使用预设的大模型对所述负面文本样本构造初始微调指令数据;所述初始微调指令数据用于表示所述负面文本样本的以下至少一项信息:所述负面文本样本关联的关键字、所述负面文本样本的分类类别和所述负面文本样本分类的原因分析;

9、指令修改模块,用于在检查待微调的目标模型无法遵循所述初始微调指令数据的情况下,将所述初始微调指令数据修改为目标微调指令数据。

10、根据本公开的另一方面,提供了一种电子设备,所述电子设备包括:

11、处理器;

12、用于存储所述处理器可执行指令的存储器;

13、所述处理器,用于从所述存储器中读取所述可执行指令,并执行所述指令以实现上述方法。

14、根据本公开的另一方面,提供了一种计算机可读存储介质,所述存储介质存储有计算机程序,所述计算机程序用于执行上述方法。

15、本公开实施例提供的技术方案与现有技术相比具有如下优点:

16、本公开提供的技术方案包括:将负面文本样本的标签划分为多个级别的目标分类标签;基于目标分类标签,使用预设的大模型对负面文本样本构造初始微调指令数据;初始微调指令数据用于表示负面文本样本的以下至少一项信息:负面文本样本关联的关键字、负面文本样本的分类类别和负面文本样本分类的原因分析;在检查待微调的目标模型无法遵循初始微调指令数据的情况下,将初始微调指令数据修改为目标微调指令数据。本技术方案针对从知识库或网络上中搜索到负面文本样本,先划分目标分类标签,在基于此构造初始微调指令数据,其中,对于模型不能理解指令的问题,本实施例可以检查目标模型是否能遵循初始微调指令数据,并在无法遵循的情况下,将初始微调指令数据修改为目标微调指令数据,由此得到的目标微调指令能够使文本分类任务更好的拟合预训练目标模型的知识,提高了微调指令的可用性。

技术特征:

1.一种微调指令的构造方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述将负面文本样本的标签划分为多个级别的目标分类标签,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述目标分类标签,使用预设的大模型对所述负面文本样本构造初始微调指令数据,包括:

4.根据权利要求3所述的方法,其特征在于,在所述使用预设的大模型对所述负面文本样本构造初始微调指令数据之后,所述方法还包括:

5.根据权利要求1所述的方法,其特征在于,所述在检查待微调的目标模型无法遵循所述初始微调指令数据的情况下,将所述初始微调指令数据修改为目标微调指令数据,包括:

6.根据权利要求5所述的方法,其特征在于,所述对所述初始微调指令数据进行文本修改,包括:

7.根据权利要求1所述的方法,其特征在于,所述方法还包括:

8.一种微调指令的构造装置,其特征在于,包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备实现如权利要求1-7中任一所述的方法。

技术总结本公开涉及一种微调指令的构造方法、装置、设备及介质,该方法包括:将负面文本样本的标签划分为多个级别的目标分类标签;基于目标分类标签,使用预设的大模型对负面文本样本构造初始微调指令数据;在检查待微调的目标模型无法遵循初始微调指令数据的情况下,将初始微调指令数据修改为目标微调指令数据。本公开针对从知识库或网络上中搜索到负面文本样本,先划分目标分类标签,在基于此构造初始微调指令数据,其中,对于模型不能理解指令的问题,本实施例可以检查目标模型是否能遵循初始微调指令数据,并在无法遵循的情况下,将初始微调指令数据修改为目标微调指令数据,由此得到的目标微调指令能够使文本分类任务更好的拟合预训练目标模型的知识,提高了微调指令的可用性。技术研发人员:杨菁林,贺敏,董琳,徐小磊,郭富民,李林,施力,张栋,毛洪亮,王琨,陈梓瑄,秦韬受保护的技术使用者:国家计算机网络与信息安全管理中心技术研发日:技术公布日:2024/10/10

本文地址:https://www.jishuxx.com/zhuanli/20241015/314168.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。