技术新讯 > 计算推算,计数设备的制造及其应用技术 > 任务处理方法、设备、介质和程序与流程  >  正文

任务处理方法、设备、介质和程序与流程

  • 国知局
  • 2024-08-05 11:43:17

本公开涉及人工智能技术、机器学习技术,尤其是一种任务处理方法、设备、介质和程序。

背景技术:

1、大模型(large model,lm),是指具有大量参数和复杂结构的机器学习模型,能够处理海量数据、完成各种复杂的任务,如自然语言处理、计算机视觉、语音识别等。

2、在实现本公开的过程,本发明人通过研究发现,当遇到任务难度较高或者输入文本的长度超出大模型能准确推理的范围时,大模型的输出结果会出现与任务无关的内容、重复字符等错误情况,从而影响任务处理结果的准确性。

技术实现思路

1、本公开实施例提供一种任务处理方法和装置、设备、介质和程序,以至少一定程度上提升任务处理结果的准确性。

2、本公开实施例的一个方面,提供一种任务处理方法包括:

3、利用预先训练好的任务处理模型针对输入任务进行解码处理,得到解码结果;

4、利用预先训练好的质检模型对所述解码结果进行质量检测,得到质量检测结果;

5、基于所述质量检测结果,响应于所述解码结果满足预设质量标准,输出所述解码结果对应的任务处理结果。

6、可选地,在本公开任一方法实施例中,还包括:

7、响应于所述解码结果不满足预设质量标准,所述质检模型向所述任务处理模型发送低质量提示,以使所述任务处理模型更新所述解码结果;

8、针对更新后的解码结果,迭代执行所述利用预先训练好的质检模型对所述解码结果进行质量检测,得到质量检测结果的操作。

9、可选地,在本公开任一方法实施例中,利用预先训练好的任务处理模型针对输入任务进行解码处理,得到解码结果,包括:

10、利用所述任务处理模型针对所述输入任务进行解码处理,得到至少一个中间结果,每个中间结果包括前k个候选词;其中,k为大于0的整数;

11、基于所述至少一个中间结果确定解码结果;

12、响应于所述解码结果满足预设质量标准,输出所述解码结果对应的任务处理结果,包括:

13、响应于所述解码结果满足预设质量标准,确定所述解码结果为任务处理结果;

14、输出所述任务处理结果。

15、可选地,在本公开任一方法实施例中,还包括:

16、响应于所述任务处理模型每得到一个中间结果,利用所述质检模型对所述中间结果进行质量检测,得到子检测结果;

17、基于所述子检测结果,确定所述中间结果是否满足预设质量标准;

18、响应于所述中间结果不满足预设质量标准,所述质检模型向所述任务处理模型发送低质量提示,以使所述任务处理模型更新所述中间结果;

19、针对更新后的中间结果,迭代执行所述利用所述质检模型对所述中间结果进行质量检测,得到子检测结果的操作。

20、可选地,在本公开任一方法实施例中,利用预先训练好的任务处理模型针对输入任务进行解码处理,得到解码结果,包括:

21、利用所述任务处理模型针对所述输入任务进行解码处理,得到至少一个中间结果,每个中间结果包括前k个候选词;其中,k为大于0的整数;

22、利用预先训练好的质检模型对所述解码结果进行质量检测,得到质量检测结果,包括:

23、响应于所述任务处理模型每得到一个中间结果,利用预先训练好的质检模型对所述中间结果进行质量检测,得到子检测结果;

24、响应于所述解码结果不满足预设质量标准,所述质检模型向所述任务处理模型发送低质量提示,以使所述任务处理模型更新所述解码结果,包括:

25、响应于所述中间结果不满足预设质量标准,所述质检模型向所述任务处理模型发送低质量提示,以使所述任务处理模型更新所述中间结果;

26、针对更新后的解码结果,迭代执行所述利用预先训练好的质检模型对所述解码结果进行质量检测,得到质量检测结果的操作,包括:

27、针对更新后的中间结果,迭代执行所述利用所述质检模型对所述中间结果进行质量检测,得到子检测结果的操作;

28、响应于所述解码结果满足预设质量标准,输出所述解码结果对应的任务处理结果,包括:

29、响应于所述至少一个中间结果满足预设质量标准,基于所述至少一个中间结果确定解码结果,并确定所述解码结果为任务处理结果;

30、输出所述任务处理结果。

31、可选地,在本公开任一方法实施例中,还包括训练得到所述质检模型的操作:

32、获取第一训练样本集,所述第一训练样本集包括至少一个第一训练样本,每个所述第一训练样本包括输入样本、输出样本、以及所述输出样本的整体质量标签;

33、利用所述第一训练样本集对初始模型进行训练,直至满足第一预设训练完成条件,以由所述初始模型得到所述质检模型。

34、可选地,在本公开任一方法实施例中,利用所述第一训练样本集对初始模型进行训练,直至满足第一预设训练完成条件,包括:

35、分别将所述第一训练样本集中的各第一训练样本输入所述初始模型,经所述初始模型输出各所述第一训练样本中输出样本对应的质量预测结果;

36、基于各所述第一训练样本对应的质量预测结果与整体质量标签,对初始模型进行训练,直至满足第一预设训练完成条件。

37、可选地,在本公开任一方法实施例中,分别将所述第一训练样本集中的各第一训练样本输入所述初始模型之前,还包括:

38、分别针对各所述第一训练样本,确定所述第一训练样本中输入样本的数据长度是否大于预设长度;

39、响应于所述第一训练样本中输入样本的数据长度大于预设长度,对所述输入样本进行重采样,以将所述输入样本的数据长度转换为不大于所述预设长度的输入样本;

40、将所述第一训练样本中的输入样本更新为转换后的输入样本。

41、可选地,在本公开任一方法实施例中,利用所述第一训练样本集对初始模型进行训练,直至满足第一预设训练完成条件,以由所述初始模型得到所述质检模型,包括:

42、利用所述第一训练样本集对初始模型进行训练,直至满足第一预设训练完成条件,由所述初始模型得到中间模型;

43、对所述任务处理模型和所述中间模型进行联合训练,直至满足第二预设训练完成条件,由所述中间模型得到所述质检模型。

44、可选地,在本公开任一方法实施例中,对所述任务处理模型和所述中间模型进行联合训练,直至满足第二预设训练完成条件,包括:

45、获取第二训练样本集,所述第二训练样本集包括至少一个第二训练样本,每个所述第二训练样本包括输入样本、至少一个中间结果样本、以及所述至少一个中间结果样本中各中间结果样本对应的子质量标签;

46、分别针对所述第二训练样本集中的各第二训练样本,将所述第二训练样本输入所述任务处理模型,经所述任务处理模型依次输出针对所述第二训练样本中输入样本解码得到的各预测中间结果;

47、将所述第二训练样本和所述各预测中间结果输入所述中间模型,经所述中间模型输出所述各预测中间结果的质量预测结果;

48、基于各第二训练样本对应的各预测中间结果的质量预测结果与对应的中间结果样本的子质量标签,对所述任务处理模型和/或所述中间模型进行训练,直至满足第二预设训练完成条件。

49、本公开实施例的另一个方面,提供一种任务处理装置,包括:

50、任务处理模块,用于利用预先训练好的任务处理模型针对输入任务进行解码处理,得到解码结果;

51、质检模块,用于利用预先训练好的质检模型对所述解码结果进行质量检测,得到质量检测结果;

52、输出模块,用于基于所述质量检测结果,响应于所述解码结果满足预设质量标准,输出所述解码结果对应的任务处理结果。

53、本公开实施例的又一个方面,提供一种任务处理装置,包括:

54、任务处理模型,用于针对输入任务进行解码处理,得到解码结果;

55、质检模型,用于对所述解码结果进行质量检测,得到质量检测结果;

56、控制模块,用于基于所述质量检测结果,响应于所述解码结果满足预设质量标准,指示所述任务处理模型输出所述解码结果对应的任务处理结果。

57、本公开实施例的又一个方面,提供一种电子设备,包括:

58、存储器,用于存储计算机程序;

59、处理器,用于执行所述存储器中存储的计算机程序,且所述计算机程序被执行时,实现本公开任一实施例所述的方法。

60、本公开实施例的再一个方面,提供计算机可读存储介质,其上存储有计算机程序指令,该计算机程序指令被处理器执行时,实现本公开任一实施例所述的方法。

61、本公开实施例的再一个方面,提供计算机程序,包括计算机程序指令,该计算机程序指令被处理器执行时实现本公开任一实施例所述的方法。

62、基于本公开实施例,提供了一种基于质检模型辅助任务处理模型解码的联合解码方案,利用任务处理模型针对输入任务进行解码处理,得到解码结果后,利用质检模型对该解码结果进行质量检测,得到质量检测结果,基于该质量检测结果,只有在任务处理模型得到的解码结果满足预设质量标准时,才输出该解码结果对应的任务处理结果,通过在任务处理模型进行任务处理的过程中引入质检模型对任务处理模型的解码结果进行质量检测,有助于提高任务处理模型解码的准确性,从而保证任务处理结果的准确性。

63、下面通过附图和实施例,对本公开的技术方案做进一步的详细描述。

本文地址:https://www.jishuxx.com/zhuanli/20240802/259011.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。