技术新讯 > 计算推算,计数设备的制造及其应用技术 > 语种识别模型的训练方法、装置、电子设备以及存储介质与流程  >  正文

语种识别模型的训练方法、装置、电子设备以及存储介质与流程

  • 国知局
  • 2024-07-31 22:57:43

本申请涉及语种识别,更具体地,涉及一种语种识别模型的训练方法、装置、电子设备以及存储介质。

背景技术:

1、语种识别技术用于模仿人的思维对语音进行语种辨识,通过从语音信号中提取出各语种的差异信息,并以此为依据判断所属语种,语种识别是自然语言处理领域中一个重要的研究分支。

2、通常利用预设的损失函数以及包括大量训练样本的训练样本集对模型进行训练,以得到用于识别多个语种的语种识别模型。而若想要在语种分类时获得更高的精度,则要求同一个语种区域的多个特征之间的差距较小,而不同语种的特征之间差距较大,同一个语种的不同特征之间的差异形成类内距离,不同类别之间的特征之间的差异形成类间距离。在相关技术中,通常对语种识别模型训练时,预设损失函数中的类间距离是固定的,但由于不同语种的样本数据不平衡、部分语种的训练样本数量匮乏、语种类别错综繁杂,往往会使得训练得到的语种识别模型对于易混淆的语种难以达到理想的识别精度。

技术实现思路

1、有鉴于此,本申请提出了一种语种识别模型的训练方法、装置、电子设备以及存储介质。

2、第一方面,本申请实施例提供了一种语种识别模型的训练方法,所述方法包括:根据训练样本集以及目标损失函数,对用于识别多个语种的初始识别模型进行训练,所述目标损失函数中包括所述多个语种中每个语种对应的类间距离,所述类间距离用于表示所述每个语种的决策边界与其他语种的决策边界之间的距离;根据测试样本集,对训练后的所述初始识别模型进行测试,得到测试结果;根据所述测试结果,确定所述初始识别模型识别所述每个语种时的分类混淆率,作为所述每个语种对应的分类混淆率,所述分类混淆率用于表征所述初始识别模型识别所述每个语种时与其他语种产生混淆的概率;若目标语种对应的分类混淆率大于或等于目标阈值,则在减小所述目标损失函数中的所述目标语种对应的类间距离之后,返回所述根据训练样本集以及目标损失函数,对用于识别多个语种的初始识别模型进行训练的步骤,直至所述每个语种对应的分类混淆率小于所述目标阈值。

3、第二方面,本申请实施例提供了一种语种识别模型的训练装置,所述装置包括:第一模型训练模块,用于根据训练样本集以及目标损失函数,对用于识别多个语种的初始识别模型进行训练,所述目标损失函数中包括所述多个语种中每个语种对应的类间距离,所述类间距离用于表示所述每个语种的决策边界与其他语种的决策边界之间的距离;测试模块,用于根据测试样本集,对训练后的所述初始识别模型进行测试,得到测试结果;分类混淆率确定模块,用于根据所述测试结果,确定所述初始识别模型识别所述每个语种时的分类混淆率,作为所述每个语种对应的分类混淆率,所述分类混淆率用于表征所述初始识别模型识别所述每个语种时与其他语种产生混淆的概率;第二模型训练模块,用于若目标语种对应的分类混淆率大于或等于目标阈值,则在减小所述目标损失函数中的所述目标语种对应的类间距离之后,返回所述根据训练样本集以及目标损失函数,对用于识别多个语种的初始识别模型进行训练的步骤,直至所述每个语种对应的分类混淆率小于所述目标阈值。

4、第三方面,本申请实施例提供了一种电子设备,所述电子设备包括:一个或多个处理器;存储器;一个或多个程序,其中所述一个或多个程序被存储在所述存储器中并被配置为由所述一个或多个处理器执行,所述一个或多个程序配置用于执行上述的方法。

5、第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行上述的方法。

6、本申请提供的方案中,根据训练样本集以及目标损失函数,对用于识别多个语种的初始识别模型进行训练,目标损失函数中包括多个语种中每个语种对应的类间距离,类间距离用于表示每个语种的决策边界与其他语种的决策边界之间的距离;根据测试样本集,对训练后的初始识别模型进行测试,得到测试结果;根据测试结果,确定初始识别模型识别每个语种时的分类混淆率,作为每个语种对应的分类混淆率,分类混淆率用于表征初始识别模型识别每个语种时与其他语种产生混淆的概率;若目标语种对应的分类混淆率大于或等于目标阈值,则在减小目标损失函数中的目标语种对应的类间距离之后,返回根据训练样本集以及目标损失函数,对用于识别多个语种的初始识别模型进行训练的步骤,直至每个语种对应的分类混淆率小于目标阈值。如此,为避免出现由于目标损失函数中易混淆的语种对应的类间距离过大,用于识别多个语种的语种识别模型在被训练后对其识别精度不理想的问题,本申请通过在每次对初始识别模型进行训练后,通过对训练后的初始识别模型进行测试,确定出初始识别模型识别每个语种时的分类混淆率,然后通过对目标损失函数中分类混淆率大于或等于目标阈值的目标语种的类间距离进行减小后,基于调整后的目标损失函数对初始识别模型进行重新训练,从而优化了模型训练的过程,使得训练后的初始识别模型针对各个语种进行识别时的分类混效率均小于目标阈值,进而提升了最终利用目标损失函数训练得到的语种识别模型对各个语种的识别精度。

技术特征:

1.一种语种识别模型的训练方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述类间距离为初始类间距离与类间距离缩放系数的乘积,所述若目标语种对应的分类混淆率大于或等于目标阈值,则在减小所述目标损失函数中的所述目标语种对应的类间距离之后,返回所述根据训练样本集以及目标损失函数,对用于识别多个语种的初始识别模型进行训练的步骤,直至所述每个语种对应的分类混淆率小于所述目标阈值,包括:

3.根据权利要求2所述的方法,其特征在于,所述语种识别模型用于进行由大到小的多个分类粒度下的语种分类,所述多个语种包括多个第一语种,所述多个第一语种为第一目标分类粒度下的多个语种;

4.根据权利要求3所述的方法,其特征在于,在所述根据所述训练样本集以及与所述多个第一语种相关联的目标损失函数,对用于识别所述多个第一语种的初始识别模型进行训练之前,所述方法还包括:

5.根据权利要求3所述的方法,其特征在于,在所述根据所述训练样本集以及与所述多个第一语种相关联的目标损失函数,对用于识别所述多个第一语种的初始识别模型进行训练之前,所述方法还包括:

6.根据权利要求1-5任一项所述的方法,其特征在于,所述根据训练样本集以及目标损失函数,对用于识别多个语种的初始识别模型进行训练,包括:

7.根据权利要求6所述的方法,其特征在于,所述根据所述识别结果以及所述目标损失函数,确定训练后的所述初始识别模型识别所述多个语种时的总损失值,包括:

8.一种语种识别模型的训练装置,其特征在于,所述装置包括:

9.一种电子设备,其特征在于,所述电子设备包括:

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有程序代码,所述程序代码可被处理器调用执行如权利要求1至7任一项所述的方法。

技术总结本申请公开了一种语种识别模型的训练方法、装置、电子设备以及存储介质,该方法包括:根据训练样本集以及目标损失函数,对用于识别多个语种的初始识别模型进行训练,目标损失函数中包括每个语种对应的用于表示其决策边界与其他语种的决策边界之间的距离的类间距离;根据测试样本集,对训练后的初始识别模型进行测试;根据得到的测试结果,确定初始识别模型识别每个语种时的分类混淆率;若目标语种对应的分类混淆率大于或等于目标阈值,则在减小目标损失函数中的目标语种对应的类间距离之后,返回对初始识别模型进行训练的步骤,直至每个语种对应的分类混淆率小于目标阈值。如此,提高了训练得到的语种识别模型对各个语种的识别精度。技术研发人员:郑颖龙,吴广财,唐乐,陈非,马春受保护的技术使用者:南方电网数字电网集团有限公司广东分公司技术研发日:技术公布日:2024/7/29

本文地址:https://www.jishuxx.com/zhuanli/20240730/195495.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。