技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于大语言模型的机器译文质量估计方法  >  正文

一种基于大语言模型的机器译文质量估计方法

  • 国知局
  • 2024-08-05 11:48:55

本发明涉及自然语言处理,具体为一种基于大语言模型的机器译文质量估计方法。

背景技术:

1、机器译文质量估计(quality estimation, qe),又称为无人工参考译文的机器译文自动评价方法,是在不借助人工参考译文的情况下自动实时地预测机器译文质量的优劣,它是机器翻译中一个重要任务,在机器译文后编辑和机器翻译系统自训练中发挥着重要的作用。

2、在缺乏人工参考译文对照的情况下,关于如何自动评价机器译文的质量,学者们通常从源语言句子和机器译文二元组中提取表征机器译文质量的特征,利用回归模型预测机器译文质量。机器译文质量估计根据特征提取和模型构建的不同,分为基于传统机器学习的方法、基于神经翻译模型的方法和基于预训练语言模型的方法。当前主流的是基于预训练语言模型的方法。

3、最近,大语言模型成为了预训练语言模型的最新研究方式,如chatgpt和llama等。大语言模型在自然语言处理任务上的应用主要包括以下两个方面:一方面是继承于预训练语言模型,使用大语言模型进行词语深度表征,并通过微调使其适应下游任务;另一方面大语言模型是一个大一统模型,借助提示可以直接执行自动问答和机器翻译等任务。基于此,本技术提供一种基于大语言模型的机器译文质量估计方法,以提高机器译文质量估计与人类评价的相关性。

技术实现思路

1、本发明提供了一种基于大语言模型的机器译文质量估计方法,结合大语言模型这两方面的特点,将大语言模型对机器译文和源语言句子的表征输入引入辅助分类任务的神经网络中预测机器译文质量;同时由大语言模型进行翻译生成伪参考译文,使用伪参考译文代替人工参考译文采用机器译文自动评价方法进行译文质量评价,将两者相结合预测机器译文质量。

2、本发明采用的技术方案如下:一种基于大语言模型的机器译文质量估计方法,先进行基于大语言模型深度表征的机器译文质量估计模型训练,其步骤如下:

3、步骤s1,获取训练集,对训练集进行规范化处理,获得规范化处理后的训练集;训练集由多个不同样本组成,每个样本包括源语言句子、机器译文、机器译文的人类评价分值、机器译文的人类评价类别(0-9,10个类别描述机器译文质量等级);

4、步骤s2,提取源语言句子至机器译文的相似度特征向量;将规范化处理后的训练集内每个样本中的源语言句子和机器译文顺序相连,输入到大语言模型,输出源语言句子至机器译文的子词级别特征向量,提取源语言句子至机器译文的子词级别特征向量的最后一个子词的特征向量作为源语言句子至机器译文的相似度特征向量;

5、步骤s3,提取机器译文至源语言句子的相似度特征向量;将规范化处理后的训练集内每个样本中的机器译文和源语言句子顺序相连,输入到大语言模型,输出机器译文至源语言句子的子词级别特征向量,提取机器译文至源语言句子的子词级别特征向量的最后一个子词的特征向量作为机器译文至源语言句子的相似度特征向量;

6、步骤s4,提取机器译文质量估计特征向量;将步骤s2中源语言句子至机器译文的相似度特征向量和步骤s3中机器译文至源语言句子的相似度特征向量拼接后输入到机器译文质量估计任务适配器层(一种全连接神经网络),输出机器译文质量估计特征向量;

7、步骤s5,预测基于大语言模型深度表征的机器译文质量得分;将步骤s4中机器译文质量估计特征向量输入到主回归网络层(一种全连接神经网络),预测基于大语言模型深度表征的机器译文质量得分;

8、步骤s6,预测基于大语言模型深度表征的机器译文质量类别;将步骤s4中机器译文质量估计特征向量输入到辅助分类网络层(一种全连接神经网络),预测基于大语言模型深度表征的机器译文质量类别;

9、步骤s7,训练基于大语言模型深度表征的机器译文质量估计模型;

10、根据步骤s5中预测的基于大语言模型深度表征的机器译文质量得分和步骤s1中规范化处理后的训练集内机器译文的人类评价分值,计算在训练集上的均方差损失;

11、根据步骤s6中预测的基于大语言模型深度表征的机器译文质量类别和步骤s1中规范化处理后的训练集内机器译文的人类评价类别,计算在训练集上的交叉熵损失;

12、线性加权在训练集上的均方差损失和在训练集上的交叉熵损失作为在训练集上的总损失,最小化在训练集上的总损失来训练基于大语言模型深度表征的机器译文质量估计模型的参数,得到训练后的基于大语言模型深度表征的机器译文质量估计模型。

13、进一步的,步骤s1中训练集由多个不同样本组成,每个样本具体为:

14、步骤s110,给定训练集中一个样本d={src, hypothesis, y},其中d表示一个训练样本,src表示源语言句子, hypothesis表示机器译文, y表示机器译文的人类评价分值;

15、将机器译文的人类评价分值使用最小-最大规范化方法缩放至[0,1]区间范围内,得到机器译文缩放后的人类评价分值,如公式(1)所示:

16、                             (1);

17、其中,yscaled表示机器译文缩放后的人类评价分值;ymax、ymin分别表示在训练集中机器译文的人类评价分值的最大值和在训练集中机器译文的人类评价分值的最小值;

18、步骤s111,采用平均分类的方法设置机器译文的人类评价类别;将机器译文缩放后的人类评价分值按照所处的区间划分质量等级,质量等级是从0开始连续的10个自然数,如公式(2)所示:

19、                                 (2);

20、其中,z表示机器译文的人类评价类别。

21、进一步的,步骤s2中提取源语言句子至机器译文的相似度特征向量,具体为:

22、步骤s21,将规范化处理后的训练集内每个样本中的源语言句子和机器译文顺序相连,如公式(3)所示:

23、   (3);

24、其中,s2h表示源语言句子至机器译文联合字符串,符号<s>、</s>表示字符串的起始符和字符串的终止符;

25、步骤s22,将源语言句子至机器译文联合字符串输入到大语言模型llama 2,由大语言模型llama 2使用子词切分方法sentencepiece算法对源语言句子至机器译文联合字符串进行子词切分,得到包含m个子词的子词序列,如公式(4)所示:

26、      (4);

27、其中,m表示源语言句子至机器译文联合字符串进行子词切分的子词个数;s1,s2,sm表示源语言句子至机器译文联合字符串进行子词切分后的第1个子词,第2个子词,第m个子词;

28、步骤s23,大语言模型llama 2按照从左向右的顺序逐词生成源语言句子至机器译文的子词级别特征向量,如公式(5)所示:

29、     (5);

30、其中,vs2h表示源语言句子至机器译文的子词级别特征向量,llama2()表示大语言模型llama 2输出函数,vs1,vs2,vsm分别表示源语言句子至机器译文的第1个子词的特征向量,第2个子词的特征向量,第m个子词的特征向量;

31、步骤s24,大语言模型llama 2采用单向深度表示方法,最后一个子词的特征向量包含整个字符串的信息,提取源语言句子至机器译文的子词级别特征向量的最后一个子词的特征向量vsm作为源语言句子至机器译文的相似度特征向量。

32、进一步的,步骤s3中提取机器译文至源语言句子的相似度特征向量,具体为:

33、步骤s31,将规范化处理后的训练集内每个样本中机器译文和源语言句子顺序相连,如公式(6)所示:

34、   (6);

35、其中,h2s表示机器译文至源语言句子联合字符串;

36、步骤s32,将机器译文至源语言句子联合字符串输入到大语言模型llama 2,由大语言模型llama 2使用子词切分方法sentencepiece算法对机器译文至源语言句子联合字符串进行子词切分,得到包含n个子词的子词序列,如公式(7)所示:

37、                      (7);

38、其中,n表示机器译文至源语言句子联合字符串进行子词切分的子词个数;h1,h2,hn表示机器译文至源语言句子联合字符串进行子词切分后的第1个子词,第2个子词,第n个子词;

39、步骤s33,大语言模型llama 2按照从左向右的顺序逐词生成机器译文至源语言句子的子词级别特征向量,如公式(8)所示:

40、      (8);

41、其中,vh2s表示机器译文至源语言句子的子词级别特征向量, vh1,vh2,vhn分别表示机器译文至源语言句子的子词级别特征向量的第1个子词的特征向量,第2个子词的特征向量,第n个子词的特征向量;

42、步骤s34,取机器译文至源语言句子的子词级别特征向量的最后一个子词的特征向量vhn作为机器译文至源语言句子的相似度特征向量。

43、进一步的,步骤s4中提取机器译文质量估计特征向量,具体为:

44、步骤s41,将步骤s2中源语言句子至机器译文的相似度特征向量和步骤s3中机器译文至源语言句子的相似度特征向量拼接,如公式(9)所示:

45、                          (9);

46、其中,x表示机器译文和源语言句子拼接特征向量,符号“⊕”表示向量拼接运算;

47、步骤s42,将机器译文和源语言句子拼接特征向量输入到机器译文质量估计任务适配器层,输出机器译文质量估计特征向量,如公式(10)所示:

48、            (10);

49、其中,qefv表示机器译文质量估计特征向量,tanh()表示神经网络的激活函数tanh,参数w1和b1为神经网络的可学习参数,t表示矩阵的转置操作。

50、进一步的,步骤s5中预测基于大语言模型深度表征的机器译文质量得分,具体为:

51、将步骤s4中机器译文质量估计特征向量输入主回归网络层,预测基于大语言模型深度表征的机器译文质量得分,如公式(11)所示:

52、                      (11);

53、其中,pvalues为预测的基于大语言模型深度表征的机器译文质量得分,参数w2和b2为神经网络的可学习参数。

54、进一步的,步骤s6中预测基于大语言模型深度表征的机器译文质量类别,具体为:

55、将步骤s4中机器译文质量估计特征向量输入辅助分类网络层,预测基于大语言模型深度表征的机器译文质量类别,如公式(12)和公式(13)所示:

56、                  (12);

57、                   (13);

58、其中,probs为预测的基于大语言模型深度表征的机器译文质量类别概率,pclass为预测的基于大语言模型深度表征的机器译文质量类别,argmax()是返回向量最大值索引函数,softmax()表示神经网络的激活函数softmax,参数w3和b3为神经网络的可学习参数。

59、进一步的,步骤s7中训练基于大语言模型深度表征的机器译文质量估计模型,具体为:

60、步骤s71,根据步骤s5中预测的基于大语言模型深度表征的机器译文质量得分和步骤s1中规范化处理后的训练集内机器译文的人类评价分值,计算在训练集上的均方差损失,如公式(14)所示:

61、                   (14);

62、其中,mse表示在训练集上的均方差损失,n表示训练集中样本的数量,i表示训练集中第i条样本,y(i)表示训练集中第i条样本机器译文的人类评价分值,pvalues(i)表示第i条样本预测的基于大语言模型深度表征的机器译文质量得分;

63、步骤s72,根据步骤s6中预测的基于大语言模型深度表征的机器译文质量类别和步骤s1中规范化处理后的训练集内机器译文的人类评价类别,计算在训练集上的交叉熵损失,如公式(15)所示:

64、                 (15);

65、其中,crossentropy表示在训练集上的交叉熵损失,z(i)表示训练集中第i条样本机器译文的人类评价类别,表示训练集中第i条样本预测的基于大语言模型深度表征的机器译文质量类别概率在第z(i)类别上的概率值;

66、步骤s73,线性加权在训练集上的均方差损失和在训练集上的交叉熵损失作为在训练集上的总损失,如公式(16)所示:

67、                   (16);

68、其中,sumloss表示在训练集上的总损失,0.2是线性插值权值,通过实验经验取得;

69、步骤s74,最小化在训练集上的总损失来训练基于大语言模型深度表征的机器译文质量估计模型的参数,得到训练后的基于大语言模型深度表征的机器译文质量估计模型,如公式(17)和公式(18)所示:

70、                   (17);

71、                 (18);

72、其中,表示最小化在训练集上的总损失的一组最优参数;argmin是取最小值时最优参数的函数;θ表示基于大语言模型深度表征的机器译文质量估计模型的参数,包括大语言模型llama 2中参数,参数为神经网络的可学习参数w1, w2,w3和b1, b2, b3;preds是预测的机器译文质量分值;g表示基于大语言模型深度表征的机器译文质量估计模型,当给定源语言句子src、机器译文hypothesis和总损失的一组最优参数时,输出预测的机器译文质量分值。

73、进一步的,本发明采用的另外一种技术方案:一种基于大语言模型的机器译文质量估计方法,还包括如下步骤:

74、步骤s8,对源语言句子、机器译文进行规范化处理后输入至步骤s7中训练后的基于大语言模型深度表征的机器译文质量估计模型,预测基于大语言模型深度表征的机器译文质量得分;

75、步骤s9,利用提示使用大语言模型进行机器翻译生成源语言句子的伪参考译文;编制提示与源语言句子相连形成翻译指令,在对话模式下将翻译指令输入大语言模型输出源语言句子的翻译结果,将源语言句子的翻译结果作为伪参考译文;

76、步骤s10,将源语言句子、机器译文和伪参考译文输入机器译文自动评价方法计算基于大语言模型提示的机器译文质量得分;将源语言句子、机器译文和伪参考译文输入机器译文自动评价方法输出机器译文质量得分,选取其中最高的得分为基于大语言模型提示的机器译文质量得分;

77、步骤s11,计算基于大语言模型的机器译文质量得分;线性加权步骤s8中预测的基于大语言模型深度表征的机器译文质量得分和步骤s10中基于大语言模型提示的机器译文质量得分,获取基于大语言模型的机器译文质量得分。

78、进一步的,步骤s9中利用提示使用大语言模型进行机器翻译生成源语言句子的伪参考译文,具体为:

79、编制提示与源语言句子相连形成翻译指令,如公式(19)和公式(20)所示:

80、<mstyle displaystyle="true" mathcolor="#000000"><mi>transprompt1 </mi><mi>←</mi><mi> translate from [</mi><mi>srclang</mi><mi>]</mi><mi> to [</mi><mi>trglang</mi><mi>]</mi><mi>: </mi><mi>src</mi></mstyle>   (19);

81、(20);

82、其中,transprompt1,transprompt2分别为第一条翻译指令和第二条翻译指令,translate from[]to[]和 translate[]to[]表示翻译指令中的翻译提示语;srclang为源语言名称,trglang为目标语言名称;

83、在对话模式下将翻译指令输入到大语言模型输出源语言句子的翻译结果,如公式(21)和公式(22)所示:

84、    (21);

85、   (22);

86、其中,pseudoref1,pseudoref2分别为源语言句子的翻译结果,llama2chat()为对话模式下大语言模型llama 2输出函数;

87、将源语言句子的翻译结果pseudoref1,pseudoref2作为伪参考译文。

88、进一步的,步骤s10中将源语言句子、机器译文和伪参考译文输入机器译文自动评价方法计算基于大语言模型提示的机器译文质量得分,具体为:

89、将源语言句子、机器译文和伪参考译文输入机器译文自动评价方法输出机器译文质量得分,选取其中最高的得分为基于大语言模型提示的机器译文质量得分,如公式(23)、公式(24)和公式(25)所示:

90、    (23);

91、       (24);

92、  (25);

93、其中,metricsscore1,metricsscore2表示2个机器译文质量得分,metricsscore表示基于大语言模型提示的机器译文质量得分, metrics()表示机器译文自动评价方法输出函数, max()表示取最大值函数。

94、进一步的,步骤s11中计算基于大语言模型的机器译文质量得分,具体为:

95、线性加权步骤s8中预测的基于大语言模型深度表征的机器译文质量得分和步骤s10中基于大语言模型提示的机器译文质量得分,获取基于大语言模型的机器译文质量得分:

96、       (26);

97、其中,表示基于大语言模型的机器译文质量得分;preds表示步骤s8中预测的基于大语言模型深度表征的机器译文质量得分;0.8为线性插值权重,根据实验经验取得。

98、本发明的有益效果是:本发明将基于大语言模型的机器译文质量估计方法分解为基于大语言模型深度表征的机器译文质量估计模型和基于大语言模型提示的机器译文质量估计模型。基于大语言模型深度表征的机器译文质量估计模型使用大语言模型提取源语言句子至机器译文的相似度特征向量和机器译文至源语言句子的相似度特征向量,利用机器译文质量估计任务适配器层提取机器译文质量估计特征向量,并利用主回归网络层预测基于大语言模型深度表征的机器译文质量得分;通过最小化均方差损失和交叉熵损失的总和来训练基于大语言模型深度表征的机器译文质量估计模型中的参数。基于大语言模型提示的机器译文质量估计模型利用提示使用大语言模型进行机器翻译生成源语言句子的伪参考译文,将源语言句子、机器译文和伪参考译文输入机器译文自动评价方法计算基于大语言模型提示的机器译文质量得分。基于大语言模型的机器译文质量得分是基于大语言模型深度表征的机器译文质量得分和基于大语言模型提示的机器译文质量得分的线性加权和。

本文地址:https://www.jishuxx.com/zhuanli/20240802/259557.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。