技术新讯 > 乐器声学设备的制造及制作,分析技术 > 训练数据的确定方法、服务器及计算机可读存储介质与流程  >  正文

训练数据的确定方法、服务器及计算机可读存储介质与流程

  • 国知局
  • 2024-06-21 11:40:33

本技术涉及数据处理,特别涉及一种训练数据的确定方法、服务器及计算机可读存储介质。

背景技术:

1、大语言模型(large language model,llm)在多个领域展现出强大的能力,能适用于多种任务如对话式任务或选择式任务。然而,在json(javascript object notation,js对象简谱)等结构化数据的处理任务中,大语言模型的表现尚有不足,因而提高大语言模型的结构化数据处理能力为丞待解决的问题之一。

技术实现思路

1、本技术提供了一种训练数据的确定方法、服务器及计算机可读存储介质。

2、本技术实施方式提供一种训练数据的确定方法,包括:

3、获取原始训练数据,其中,所述原始训练数据包括第一类型的第一结构化数据和/或第二类型的第二结构化数据,所述第一类型的结构化数据通过预设结构构造,所述第二类型的结构化数据的子数据通过所述预设结构构造;

4、获取增强训练数据,其中,所述增强训练数据包括所述第二类型的第三结构化数据;

5、融合所述原始训练数据和所述增强训练数据,确定目标训练数据。

6、本技术实施方式提供的训练数据的确定方法中,服务器可获取原始训练数据,并获取增强训练数据,及融合原始训练数据与增强训练数据,以通过增强训练数据对原始训练数据进行数据增强,从而得到目标训练数据。

7、如此,在本技术实施方式中,服务器可获取由第二类型的结构化数据所构成的增强训练数据,进而将增强训练数据与原始训练数据融合,从而实现原始训练数据的增强以得到目标训练数据,进而通过目标训练数据进行大语言模型的训练,在一定程度使得大语言模型的结构化数据处理能力得以保障。

8、在本技术某些实施方式中,所述获取增强训练数据,包括:

9、获取多个候选训练数据,其中,所述候选训练数据均包括所述第二类型的第四结构化数据,任意两个所述候选训练数据包括的所述第四结构化数据的数量间存在差异;

10、利用每个所述候选训练数据分别训练预先确定的基础模型,得到每个所述候选训练数据对应的训练后模型;

11、根据所述训练后模型和所述候选训练数据,确定所述增强训练数据。

12、如此,本技术实施方式可通过分别包含有不同数量第四结构化数据的多个候选训练数据,对基础模型进行训练以得到每个候选训练数据对应的训练后模型,及根据各个训练后模型和各个候选训练数据,确定增强训练数据,在一定程度上保障了增强训练数据的可信度。

13、在本技术某些实施方式中,所述基础模型包括多个,所述利用每个所述候选训练数据分别训练预先确定的基础模型,得到每个所述候选训练数据对应的训练后模型,包括:

14、利用每个所述候选训练数据分别训练每个所述基础模型,得到每个所述候选训练数据对应的每个所述训练后模型。

15、如此,本技术实施方式的服务器可通过每个候选训练数据对应于每个基础模型的训练后数据,完成增强训练数据的确定,从而在一定程度上避免候选训练数据单一或基础模型单一而导致增强训练数据不可信的情况出现,增强训练数据的可信度得以保障。

16、在本技术某些实施方式中,所述根据所述训练后模型和所述候选训练数据,确定所述增强训练数据,包括:

17、利用预先确定的测试集对每个所述训练后模型分别进行性能测试,得到每个所述训练后模型的性能测试信息;

18、根据所述性能测试信息和所述候选训练数据,确定所述增强训练数据。

19、如此,本技术实施方式可通过预先确定的测试集,对每个训练后模型进行性能测试以得到每个训练后模型的性能测试信息,进而可根据每个训练后模型的性能测试信息,及每个训练后模型所对应的候选训练数据,完成增强训练数据的确定,在一定程度上保障增强训练数据的可靠确定。

20、在本技术某些实施方式中,所述测试集包括多个,所述利用预先确定的测试集对每个所述训练后模型分别进行性能测试,得到每个所述训练后模型的性能测试信息,包括:

21、基于多个所述测试集对每个所述训练后模型分别进行性能测试,得到每个所述训练后模型对应于每个所述测试集的测试结果,确定所述性能测试信息。

22、如此,本技术实施方式可通过多个测试集对每个训练后模型分别进行性能测试,以得到性能测试信息,进而增强训练数据的确定可基于每个训练后模型对应于每个测试集的测试结果所确定,增强训练数据的可信度得以保障。

23、在本技术某些实施方式中,所述根据所述性能测试信息和所述候选训练数据,确定所述增强训练数据,包括:

24、根据所述性能测试信息,及所述候选训练数据包括的所述第四结构化数据的数量,确定所述训练后模型相对于所述候选训练数据的性能变化信息;

25、根据所述性能变化信息和所述候选训练数据,确定所述增强训练数据。

26、如此,本技术实施方式的服务器可根据训练后模型的性能测试信息,及训练后模型对应的候选训练数据中第四结构化数据的数量,从而确定出训练后模型的性能相对于候选训练数据的性能变化信息,从而可基于性能变化信息完成增强训练数据的确定,在一定程度上保障了增强训练数据的可靠确定。

27、在本技术某些实施方式中,所述根据所述性能变化信息和所述候选训练数据,确定所述增强训练数据,包括:

28、根据所述性能变化信息,确定多个所述训练后模型中的目标模型;

29、根据所述目标模型对应的候选训练数据,确定所述增强训练数据。

30、如此,本技术实施方式的服务器可根据性能变化信息,从全部训练后模型中确定目标模型,及根据目标模型所对应的候选训练数据完成增强训练数据的确定,使得增强训练数据的可靠性得以保障。

31、在本技术某些实施方式中,所述根据所述目标模型对应的候选训练数据,确定所述增强训练数据,包括:

32、根据所述目标模型对应的候选训练数据中所述第四结构化数据的数量,确定所述增强训练数据。

33、如此,本技术实施方式的服务器可根据目标模型对应的候选训练数据所包括的第四结构化数据的数量,确定增强训练数据可包括的第三结构化数据的数量,从而完成增强训练数据的确定。

34、本技术实施方式提供一种服务器,包括存储器和处理器,所述存储器中存储有计算机程序,所述计算机程序被所述处理器执行时,实现上述训练数据的确定方法。

35、本技术实施方式提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被一个或多个处理器执行时,实现上述训练数据的确定方法。

36、本技术实施方式提供的服务器和计算机可读存储介质中,可获取由第二类型的结构化数据所构成的增强训练数据,进而将增强训练数据与原始训练数据融合,从而实现原始训练数据的增强以得到目标训练数据,进而通过目标训练数据进行大语言模型的训练,在一定程度使得大语言模型的结构化数据处理能力得以保障。

37、本技术的实施方式的附加方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本技术的实施方式的实践了解到。

本文地址:https://www.jishuxx.com/zhuanli/20240618/22833.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。