技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于深度交叉网络的机器译文自动评价方法 > 正文

一种基于深度交叉网络的机器译文自动评价方法

国知局
2024-07-31 22:56:38

本发明涉及自然语言处理，具体为一种基于深度交叉网络的机器译文自动评价方法。背景技术：：：1、在机器翻译的研究和应用中，机器译文自动评价起着重要的作用。近年来随着预训练语言模型的蓬勃发展，基于神经网络的机器译文自动评价方法通过预训练语言模型提取机器译文和人工参考译文的深度表征，构建神经网络对比两者深度表征的差异来预测机器译文的质量。2、基于神经网络的机器译文自动评价方法一般基于双塔架构。它单独提取机器译文的深度表征组成机器译文表征塔，单独提取人工参考译文的深度表征组成人工参考译文表征塔，然后对双塔进行简单的交互，例如双塔特征向量拼接、双塔特征向量相同位置的元素相乘和相减取绝对值操作等，这些特征交互方式没有对双塔特征不同位置元素之间关系进行直接显式建模，即特征交叉操作。而交叉操作生成的低阶组合特征和高阶组合特征对机器译文自动评价有着重要的作用。因此，本发明提供了一种基于深度交叉网络的机器译文自动评价方法，利用深度交叉网络对机器译文特征与人工参考译文特征进行深度交互以捕捉它们之间的语义关系，从而提高机器译文自动评价的效果。技术实现思路1、本发明提供了一种基于深度交叉网络的机器译文自动评价方法，以提高机器译文自动评价与人类评价的相关性。2、本发明采用的技术方案如下：一种基于深度交叉网络的机器译文自动评价方法，其步骤如下：3、步骤s1，获取训练集，对训练集进行规范化处理，获得规范化处理后的训练集；训练集由多个不同样本组成，每个样本包括机器译文、人工参考译文和机器译文的人类评价分值；4、步骤s2，提取独立表征模式下句子级别机器译文质量特征向量；将规范化处理后的训练集内每个样本中机器译文和人工参考译文，分别输入到跨语言预训练模型，输出独立表征模式下机器译文子词级别特征向量和独立表征模式下人工参考译文子词级别特征向量，将独立表征模式下机器译文子词级别特征向量和独立表征模式下人工参考译文子词级别特征向量使用外部注意力机制进行交互得到独立表征模式下机器译文交互特征向量和独立表征模式下人工参考译文交互特征向量，连接独立表征模式下机器译文交互特征向量和独立表征模式下人工参考译文交互特征向量，并进行平均池化操作，输出独立表征模式下句子级别机器译文质量特征向量；5、步骤s3，提取统一表征模式下句子级别机器译文质量特征向量；将规范化处理后的训练集内每个样本中机器译文和人工参考译文进行字符串相连得到译文联合字符串，将译文联合字符串输入到跨语言预训练模型，输出统一表征模式下子词级别特征向量，将统一表征模式下子词级别特征向量使用自注意力机制进行交互，得到统一表征模式下交互特征向量，将统一表征模式下交互特征向量进行平均池化操作，输出统一表征模式下句子级别机器译文质量特征向量；6、步骤s4，提取机器译文质量交叉特征向量；将步骤s2中独立表征模式下句子级别机器译文质量特征向量和步骤s3中统一表征模式下句子级别机器译文质量特征向量拼接，输入到含有4个堆叠交叉层的深度交叉网络，输出机器译文质量交叉特征向量；7、步骤s5，预测机器译文质量；将步骤s4中机器译文质量交叉特征向量输入三层前馈神经网络，输出机器译文质量分值；8、步骤s6，训练基于深度交叉网络的机器译文自动评价模型；根据步骤s5中输出的机器译文质量分值和步骤s1中规范化处理后的训练集内机器译文的人类评价分值，通过最小化在规范化处理后的训练集上的均方差损失来训练基于深度交叉网络的机器译文自动评价模型的参数，得到训练后的基于深度交叉网络的机器译文自动评价模型。9、进一步的，步骤s1中训练集由多个不同样本组成，每个样本具体为：10、给定训练集中一个样本d={(h, r), y}，其中d表示一个训练样本， h表示机器译文，r表示人工参考译文， y表示对机器译文h的人类评价分值，人类评价分值介入0-1之间的实数值。11、进一步的，步骤s2中提取独立表征模式下句子级别机器译文质量特征向量，具体为：12、步骤s21，将机器译文h和人工参考译文r分别输入到跨语言预训练模型xlm-roberta，由跨语言预训练模型xlm-roberta使用子词切分方法sentencepiece算法对机器译文h和人工参考译文r进行子词切分，分别得到包含m个子词和n个子词的子词序列：13、<mstyledisplaystyle="true"mathcolor="#000000"><mtablecolumnalign="left"><mtr><mtd><mi>h</mi><mi>→</mi><mi>[</mi><msub><mi>h</mi><mn>1</mn></msub><mi>,</mi><msub><mi>h</mi><mn>2</mn></msub><mi>,...,</mi><msub><mi>h</mi><mi>m</mi></msub><mi>]</mi></mtd></mtr><mtr><mtd><mi>r</mi><mi>→</mi><mi>[</mi><msub><mi>r</mi><mn>1</mn></msub><mi>,</mi><msub><mi>r</mi><mn>2</mn></msub><mi>,...,</mi><msub><mi>r</mi><mi>n</mi></msub><mi>]</mi></mtd></mtr></mtable></mstyle>；14、其中，m和n分别表示机器译文和人工参考译文使用子词切分方法sentencepiece算法切分后包含的子词个数；h1，h2，hm表示机器译文使用子词切分方法sentencepiece算法切分后的第1个子词，第2个子词，第m个子词；r1，r2，rn表示人工参考译文切分后的第1个子词，第2个子词，第n个子词；15、步骤s22，跨语言预训练模型xlm-roberta根据子词和子词在句子中的位置输出独立表征模式下机器译文子词级别特征向量和独立表征模式下人工参考译文子词级别特征向量，如公式（1）和公式（2）所示；16、 (1)；17、 (2)；18、其中，vh和vr分别表示机器译文和人工参考译文使用跨语言预训练模型xlm-roberta输出的独立表征模式下机器译文子词级别特征向量和独立表征模式下人工参考译文子词级别特征向量，xlm-roberta(•)表示跨语言预训练模型xlm-roberta；19、步骤s23，将独立表征模式下机器译文子词级别特征向量和独立表征模式下人工参考译文子词级别特征向量,使用外部注意力机制进行交互，得到独立表征模式下机器译文交互特征向量和独立表征模式下人工参考译文交互特征向量，如公式（3）和公式（4）所示：20、 (3)；21、 (4)；22、其中，为独立表征模式下机器译文交互特征向量，为独立表征模式下人工参考译文交互特征向量；multihead(•)表示多头注意力机制函数，多头注意力机制函数中包含查询、键和值三个参数，当查询与键和值不相同时多头注意力机制转化为外部注意力机制；23、步骤s24，连接独立表征模式下机器译文交互特征向量和独立表征模式下人工参考译文交互特征向量，并进行平均池化操作，输出独立表征模式下句子级别机器译文质量特征向量如公式（5）所示：24、 (5)；25、其中，vshr表示独立表征模式下句子级别机器译文质量特征向量；avgpooling()表示平均池化操作。26、进一步的，步骤s3中提取统一表征模式下句子级别机器译文质量特征向量，具体为：27、步骤s31，将机器译文h和人工参考译文r进行字符串相连得到译文联合字符串，如公式（6）所示：28、 (6)；29、其中，hr为译文联合字符串，“</s>”表示字符串的起止符；30、步骤s32，将译文联合字符串输入跨语言预训练模型xlm-roberta，由跨语言预训练模型xlm-roberta使用子词切分方法sentencepiece算法对译文联合字符串进行子词切分，得到包含p个子词的子词序列，如公式（7）所示：31、 (7)；32、其中，p表示译文联合字符串使用子词切分方法sentencepiece算法子词切分后包含的子词个数；hr1，hr2，hrp表示译文联合字符串使用sentencepiece算法切分后的第1个子词，第2个子词，第p个子词；33、步骤s33，跨语言预训练模型xlm-roberta根据子词和子词在句子中的位置输出统一表征模式下子词级别特征向量，如公式（8）所示：34、 (8)；35、其中，vhr表示统一表征模式下子词级别特征向量；36、步骤s34，将统一表征模式下子词级别特征向量使用自注意力机制进行交互得到统一表征模式下交互特征向量，如公式（9）所示：37、 (9)；38、其中，表示统一表征模式下交互特征向量，multihead(•)表示多头注意力机制函数，多头注意力机制函数中包含查询、键和值三个参数，当查询与键和值相同时多头注意力机制转化为自注意力机制；39、步骤s35，将统一表征模式下交互特征向量进行平均池化操作，输出统一表征模式下句子级别机器译文质量特征向量，如公式（10）所示：40、 (10)；41、其中，vuhr表示统一表征模式下句子级别机器译文质量特征向量。42、进一步的，步骤s4中提取机器译文质量交叉特征向量，具体为：43、步骤s41，将步骤s2中独立表征模式下句子级别机器译文质量特征向量和步骤s3中统一表征模式下句子级别机器译文质量特征向量拼接，如公式（11）所示：44、 (11)；45、其中，x0表示机器译文拼接特征向量，符号“⊕”表示向量拼接运算；46、步骤s42，将机器译文拼接特征向量输入含有4个堆叠交叉层的深度交叉网络，输出机器译文质量交叉特征向量，如公式（12）、公式（13）、公式（14）和公式（15）所示：47、 (12)；48、 (13)；49、 (14)；50、 (15)；51、其中，x1，x2，x3，x4分别为第1个、第2个、第3个、第4个堆叠交叉层输出的交叉特征向量，将x4作为机器译文质量交叉特征向量；符号“”为哈达玛乘积运算，w1，w2，w3，w4和b1，b2，b3，b4分别为第1个、第2个、第3个、第4个堆叠交叉层的线性权值参数和偏置；需要说明的是深度交叉网络可以包含若干个堆叠交叉层，本发明使用4个堆叠交叉层是根据大量实验经验取得。52、进一步的，步骤s5中预测机器译文质量，具体为：53、将步骤s4中机器译文质量交叉特征向量输入三层前馈神经网络，输出机器译文质量分值；如公式（16）所示：54、 (16)；55、其中，score为机器译文质量分值，feed-forward为三层前馈神经网络；56、进一步的，步骤s6中均方差损失，如公式(17)所示；57、 (17)；58、其中，mse表示均方差损失，n表示训练集中样本的数量，i表示训练集中第i条样本，y(i)表示训练集中第i条样本机器译文的人类评价分值，score(i)表示第i条样本预测的机器译文质量分值。59、进一步的，本发明采用的另外一种技术方案：一种基于深度交叉网络的机器译文自动评价方法，还包括以下步骤：60、步骤s7，对待评价机器译文、待评价机器译文的人工参考译文进行规范化处理；61、步骤s8，将步骤s7中规范化处理后的待评价机器译文、待评价机器译文的人工参考译文输入至步骤s6中训练后的基于深度交叉网络的机器译文自动评价模型，预测机器译文质量分值；62、步骤s9，计算基于大语言模型向量库的机器译文句向量表征和人工参考译文句向量表征余弦相似度；将步骤s7中规范化处理后的待评价机器译文、待评价机器译文的人工参考译文分别输入大语言模型向量库，直接输出机器译文句向量表征和人工参考译文句向量表征，计算机器译文句向量表征和人工参考译文句向量表征的余弦相似度；63、步骤s10，计算机器译文质量最终预测分值；线性加权步骤s8中预测的机器译文质量分值和步骤s9中基于大语言模型向量库的机器译文句向量表征和人工参考译文句向量表征余弦相似度，获取机器译文质量最终预测分值。64、进一步的，步骤s9中计算基于大语言模型向量库的机器译文句向量表征和人工参考译文句向量表征余弦相似度，具体为：65、将步骤s7中规范化处理后的待评价机器译文、待评价机器译文的人工参考译文分别输入大语言模型向量数据库chromadb，直接输出机器译文句向量表征和人工参考译文句向量表征，如公式(18)和公式(19)所示；66、 (18)；67、 (19)；68、其中，eh，er分别表示机器译文句向量表征和人工参考译文句向量表征，chromadbzephyr-7b()表示以大语言模型zephyr-7b为基座大模型的chromadb向量数据库输出函数；69、计算机器译文句向量表征和人工参考译文句向量表征的余弦相似度，如公式(20)所示；70、 (20)；71、其中，cossim(h, r)表示机器译文句向量表征和人工参考译文句向量表征的余弦相似度，t表示转置操作。72、进一步的，步骤s10中计算机器译文质量最终预测分值，具体为：73、线性加权步骤s8中预测的机器译文质量分值和步骤s9中基于大语言模型向量库的机器译文句向量表征和人工参考译文句向量表征余弦相似度，如公式(21)所示；74、（21）；75、其中，表示机器译文质量最终预测分值；score表示步骤s8中预测的机器译文质量分值；0.8为线性插值权重，根据实验经验取得。76、本发明的有益效果是：本发明将基于深度交叉网络的机器译文自动评价方法分解为，使用预训练模型、外部注意力机制和平均池化提取独立表征模式下句子级别机器译文质量特征向量；根据机器译文和人工参考译文的整体信息使用预训练模型、自注意力机制和平均池化提取统一表征模式下句子级别机器译文质量特征向量；利用实验验证有效的含有4个堆叠交叉层的深度交叉网络提取机器译文质量交叉特征向量，并将机器译文质量交叉特征向量输入前馈神经网络自动预测机器译文质量；同时采用大语言模型向量数据库直接对机器译文和人工参考译文进行句向量表征，计算机器译文与人工参考译文的余弦相似度，将自动预测的机器译文质量与机器译文与人工参考译文的余弦相似度线性加权获取机器译文质量的分值，以提高机器译文自动评价的效果。当前第1页12当前第1页12