一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

文本翻译方法及其装置、设备、介质、产品与流程

2022-07-16 11:14:20 来源:中国专利 TAG:

技术特征:
1.一种文本翻译方法,其特征在于,包括如下步骤:获取待翻译文本;采用预先训练至收敛状态的文本翻译模型对所述待翻译文本进行翻译,获得结果文本,其中,所述待翻译文本为第一语种表述或第二语种的第一方言表述的文本,相应的,所述结果文本为第二语种的第一方言表述或第一语种表述的文本,所述文本翻译模型的训练过程包括如下步骤:调用第一训练数据集中的第一训练样本对该文本翻译模型实施迭代预训练使其收敛,所述第一训练样本为第一语种语料与第二语种语料构成的第一平行语料,所述第二语种语料为所述第一语种语料对应第二语种的第一方言的翻译文本中个别词汇被替换为第二语种的第二方言的同义词汇的结果;调用第二训练数据集中的第二训练样本对该文本翻译模型实施迭代微调训练使其收敛,所述第二训练样本为第一语种语料与第二语种的第二方言语料构成的第二平行语料。2.根据权利要求1所述的文本翻译方法,其特征在于,所述文本翻译模型的训练过程之前,包括如下步骤:获取与预设数据集中的各个以第一语种表述的原始文本相对应的第二语种的第一方言的第一翻译文本和第二方言的第二翻译文本,分别作为第一语料库和第二语料库;比较第一语料库和第二语料库中关于相同原始文本的不同翻译文本之间的同义词汇,将所述同义词汇的不同翻译版本之间的映射关系数据构造为特殊词典;调用语料资源库,该语料资源库包括第一平行语料,第一平行语料由第一语种语料与第二语种第一方言的语料两种对应文本构成;根据所述特殊词典的映射关系数据,将第一平行语料中属于第二语种第一方言的同义词汇的翻译版本替换为所述特殊词典中第二方言的同义词汇的翻译版本构成第二语种语料,使该语料资源库构成第一训练数据集。3.根据权利要求2所述的文本翻译方法,其特征在于,所述文本翻译模型的训练过程之前,还包括如下步骤:将所述预设数据集中以第一语种表述的每个原始文本与其对应第二语种第二方言的翻译文本构造为平行语料,将所述平行语料构造为第二训练数据集。4.根据权利要求2所述的文本翻译方法,其特征在于,比较第一语料库和第二语料库中关于相同原始文本的不同翻译文本之间的同义词汇,将所述同义词汇的不同翻译版本之间的映射关系数据构造为特殊词典,包括如下步骤:比较第一语料库和第二语料库中关于相同原始文本的不同翻译文本之间的差异文本;采用预先训练至收敛状态的实体名词分类模型对其中第一语料库的所述差异文本进行判断,以判别其是否为特定类型的名词;将属于特定类型的名词相对应的第一语料库和第二语料库中的所述差异文本确定为同义词汇的不同翻译版本,构造为映射关系数据,存储于预构造的特殊词典中。5.根据权利要求2所述的文本翻译方法,其特征在于,根据所述特殊词典的映射关系数据,将第一平行语料中属于第二语种第一方言的同义词汇的翻译版本替换为所述特殊词典中第二方言的同义词汇的翻译版本构成第二语种语料,包括如下步骤:根据特殊词典中所述第二语种的第一方言对应的同义词汇的翻译版本,检索所述语料
资源库中的全量平行语料中的相应目标文本;获取特殊词典中与该同义词汇相对应的第二语种的第二方言的翻译版本,随机选中部分所述的目标文本替换为所述第二方言的翻译版本。6.根据权利要求1中所述的文本翻译方法,其特征在于,采用预先训练至收敛状态的文本翻译模型对所述待翻译文本进行翻译,获得结果文本之后,包括如下步骤:响应作用于所述待翻译文本的文本替换指令,在用于获取所述待翻译文本的当前界面将该待翻译文本替换为所述结果文本进行显示;响应作用于所述结果文本的显示区域的指向事件,在所述当前界面显示文本提示框,所述文本提示框中显示所述待翻译文本。7.一种文本翻译装置,其特征在于,包括:文本获取模块,用于获取待翻译文本;模型翻译模块,用于采用预先训练至收敛状态的文本翻译模型对所述待翻译文本进行翻译,获得结果文本,其中,所述待翻译文本为第一语种表述或第二语种的第一方言表述的文本,相应的,所述结果文本为第二语种的第一方言表述或第一语种表述的文本,所述文本翻译模型的训练过程包括如下步骤:模型预训练模块,用于调用第一训练数据集中的第一训练样本对该文本翻译模型实施迭代预训练使其收敛,所述第一训练样本为第一语种语料与第二语种语料构成的第一平行语料,所述第二语种语料为所述第一语种语料对应第二语种的第一方言的翻译文本中个别词汇被替换为第二语种的第二方言的同义词汇的结果;模型微调模块,用于调用第二训练数据集中的第二训练样本对该文本翻译模型实施迭代微调训练使其收敛,所述第二训练样本为第一语种语料与第二语种的第二方言语料构成的第二平行语料。8.一种计算机设备,包括中央处理器和存储器,其特征在于,所述中央处理器用于调用运行存储于所述存储器中的计算机程序以执行如权利要求1至6中任意一项所述的方法的步骤。9.一种计算机可读存储介质,其特征在于,其以计算机可读指令的形式存储有依据权利要求1至6中任意一项所述的方法所实现的计算机程序,该计算机程序被计算机调用运行时,执行相应的方法所包括的步骤。10.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至6任意一项中所述方法的步骤。

技术总结
本申请公开一种文本翻译方法及其装置、设备、介质、产品,所述方法包括:获取待翻译文本;采用预先训练至收敛状态的文本翻译模型对所述待翻译文本进行翻译,获得结果文本,其中,所述文本翻译模型的训练过程包括如下步骤:调用第一训练数据集中的第一训练样本对该文本翻译模型实施迭代预训练使其收敛,所述第一训练样本为第一语种语料与第二语种语料构成的第一平行语料;调用第二训练数据集中的第二训练样本对该文本翻译模型实施迭代微调训练使其收敛,所述第二训练样本为第一语种语料与第二语种的第二方言语料构成的第二平行语料。本申请利用文本翻译模型实现不同语言的精准互译。请利用文本翻译模型实现不同语言的精准互译。请利用文本翻译模型实现不同语言的精准互译。


技术研发人员:庞磊 钟裕滨
受保护的技术使用者:广州华多网络科技有限公司
技术研发日:2022.03.16
技术公布日:2022/7/15
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献