歌声评价模型训练及歌声评价信息获取方法、设备和介质与流程
- 国知局
- 2024-06-21 11:55:47
本技术涉及歌声评价,特别是涉及一种歌声评价模型的训练方法、歌声评价信息获取方法、计算机设备和存储介质。
背景技术:
1、随着计算机技术发展,可以通过歌声评价模型对评价对象的歌声进行多维度的分析,得到客观的歌声评价结果。相关技术中,会由工作人员对歌声样本的歌声质量进行评价,根据歌声质量确定歌声样本所属的层级,并进行标注,然后根据各歌声样本的标签训练歌声评价模型。
2、然而,在标签层级有限的情况下,歌声评价模型往往难以得到细致的评价信息,例如在歌唱比赛场景下,若比赛双方的歌唱水平接近,通过上述方式训练得到的歌声评价模型往往难以准确区分双方歌声质量的高低,无法得到可靠的歌声评价信息。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提升歌声评价信息的准确性的歌声评价模型的训练方法、歌声评价信息获取方法、计算机设备和存储介质。
2、第一方面,本技术提供了一种歌声评价模型的训练方法。所述方法包括:
3、获取样本歌声对;每个样本歌声对中包括歌声质量不同的两样本歌声;
4、通过待训练的歌声评价模型获取所述样本歌声对中各样本歌声对应的歌声特征,基于所述歌声特征确定歌声评价分数;
5、根据所述样本歌声对中各样本歌声的歌声评价分数,以及所述样本歌声对的比较结果标签,调整所述待训练的歌声评价模型的参数,得到训练好的歌声评价模型。
6、在其中一个实施例中,所述根据所述样本歌声对中各样本歌声的歌声评价分数,以及所述样本歌声对的比较结果标签,调整所述待训练的歌声评价模型的参数,包括:
7、根据所述样本歌声对的比较结果标签,确定所述样本歌声对中的正样本歌声和负样本歌声;所述正样本歌声的歌声质量高于所述负样本歌声的歌声质量;
8、根据所述正样本歌声的歌声评价分数与所述负样本歌声的歌声评价分数之间的比对结果,确定所述样本歌声对相应的第一损失值;
9、根据所述第一损失值调整所述待训练的歌声评价模型的参数。
10、在其中一个实施例中,所述根据所述正样本歌声的歌声评价分数与所述负样本歌声的歌声评价分数之间的比对结果,确定所述样本歌声对相应的第一损失值,包括:
11、若所述正样本歌声的歌声评价分数大于所述负样本歌声的歌声评价分数,则根据所述正样本歌声的歌声评价分数减去所述负样本歌声的歌声评价分数的差值,确定所述样本歌声对相应的第一损失值;
12、若所述正样本歌声的歌声评价分数小于所述负样本歌声的歌声评价分数,则将预设值确定为所述样本歌声对相应的第一损失值。
13、在其中一个实施例中,所述比对结果为所述正样本歌声的歌声评价分数与所述负样本歌声的歌声评价分数之间的分数差异,所述第一损失值与所述分数差异呈负相关;
14、所述根据所述正样本歌声的歌声评价分数与所述负样本歌声的歌声评价分数之间的比对结果,确定所述样本歌声对相应的第一损失值,包括:
15、确定所述正样本歌声和所述负样本歌声的歌声质量等级差异;
16、根据所述正样本歌声的歌声评价分数与所述负样本歌声的歌声评价分数之间的分数差异和所述歌声质量等级差异的乘积,确定所述样本歌声对相应的第一损失值。
17、在其中一个实施例中,所述歌声评价模型还用于基于所述歌声特征确定歌声质量等级;
18、所述根据所述样本歌声对中各样本歌声的歌声评价分数,以及所述样本歌声对的比较结果标签,调整所述待训练的歌声评价模型的参数,包括:
19、基于所述样本歌声对中各样本歌声的歌声评价分数,及所述样本歌声对的比较结果标签,确定第一损失值;
20、基于所述样本歌声各自的歌声质量等级和等级标签的差异,确定第二损失值;
21、根据所述第一损失值和第二损失值确定模型损失值,根据所述模型损失值调整所述待训练的歌声评价模型的参数。
22、在其中一个实施例中,所述待训练的歌声评价模型包括参数相同的第一特征提取模块和第二特征提取模块;
23、所述通过待训练的歌声评价模型获取所述样本歌声对中各样本歌声对应的歌声特征,包括:
24、获取所述样本歌声对中两样本歌声对应的频谱特征;
25、将所述两样本歌声各自的频谱特征分别输入到第一特征提取模块和第二特征提取模块,得到所述第一特征提取模块和第二特征提取模块各自输出的歌声特征。
26、第二方面,本技术还提供了一种歌声评价信息获取方法。所述方法包括:
27、获取待比较的两个歌声音频;
28、将所述两个歌声音频输入到训练好的歌声评价模型,由所述歌声评价模型获取指示所述两个歌声音频歌声质量高低的歌声评价结果;所述歌声评价模型根据如上任一项所述的歌声评价模型的训练方法训练得到。
29、在其中一个实施例中,
30、所述将所述两个歌声音频输入到训练好的歌声评价模型,包括:对所述歌声音频进行分句处理,得到多个分句片段,并将所述多个分句片段输入到训练好的歌声评价模型;
31、所述由所述歌声评价模型获取指示所述两个歌声音频歌声质量高低的歌声评价结果,包括:通过训练好的歌声评价模型获取所述歌声音频每个分句片段的歌声特征,基于每个分句片段的歌声特征确定每个分句片段的歌声评价分数;根据所述歌声音频多个分句片段各自的歌声评价分数,确定指示所述两个歌声音频歌声质量高低的歌声评价结果。
32、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
33、获取样本歌声对;每个样本歌声对中包括歌声质量不同的两样本歌声;
34、通过待训练的歌声评价模型获取所述样本歌声对中各样本歌声对应的歌声特征,基于所述歌声特征确定歌声评价分数;
35、根据所述样本歌声对中各样本歌声的歌声评价分数,以及所述样本歌声对的比较结果标签,调整所述待训练的歌声评价模型的参数,得到训练好的歌声评价模型。
36、第四方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
37、获取待比较的两个歌声音频;
38、将所述两个歌声音频输入到训练好的歌声评价模型,由所述歌声评价模型获取指示所述两个歌声音频歌声质量高低的歌声评价结果;所述歌声评价模型根据如上任一项所述的歌声评价模型的训练方法训练得到。
39、第五方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
40、获取样本歌声对;每个样本歌声对中包括歌声质量不同的两样本歌声;
41、通过待训练的歌声评价模型获取所述样本歌声对中各样本歌声对应的歌声特征,基于所述歌声特征确定歌声评价分数;
42、根据所述样本歌声对中各样本歌声的歌声评价分数,以及所述样本歌声对的比较结果标签,调整所述待训练的歌声评价模型的参数,得到训练好的歌声评价模型。
43、第六方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
44、获取待比较的两个歌声音频;
45、将所述两个歌声音频输入到训练好的歌声评价模型,由所述歌声评价模型获取指示所述两个歌声音频歌声质量高低的歌声评价结果;所述歌声评价模型根据如上任一项所述的歌声评价模型的训练方法训练得到。
46、第七方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
47、获取样本歌声对;每个样本歌声对中包括歌声质量不同的两样本歌声;
48、通过待训练的歌声评价模型获取所述样本歌声对中各样本歌声对应的歌声特征,基于所述歌声特征确定歌声评价分数;
49、根据所述样本歌声对中各样本歌声的歌声评价分数,以及所述样本歌声对的比较结果标签,调整所述待训练的歌声评价模型的参数,得到训练好的歌声评价模型。
50、第八方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
51、获取待比较的两个歌声音频;
52、将所述两个歌声音频输入到训练好的歌声评价模型,由所述歌声评价模型获取指示所述两个歌声音频歌声质量高低的歌声评价结果;所述歌声评价模型根据如上任一项所述的歌声评价模型的训练方法训练得到。
53、上述歌声评价模型的训练方法、歌声评价信息获取方法、计算机设备和存储介质,可以获取样本歌声对,其中,每个样本歌声对中包括歌声质量不同的两样本歌声;然后,可以通过待训练的歌声评价模型获取样本歌声对中各样本歌声对应的歌声特征,基于歌声特征确定歌声评价分数;进而可以根据样本歌声对中各样本歌声的歌声评价分数,以及样本歌声对的比较结果标签,调整待训练的歌声评价模型的参数,得到训练好的歌声评价模型。在本实施例中,当歌声评价模型输出同一样本歌声对中各样本歌声的歌声评价分数后,通过样本歌声对的比较结果标签,判别歌声评价模型输出的歌声评价分数是否合适,并调整模型的参数,使得模型可以充分学习到歌声质量不同的两样本歌声之间的差异所在,对歌声质量接近的多个歌声进行准确的质量评估,提升模型输出的歌声评价信息的准确性。
本文地址:https://www.jishuxx.com/zhuanli/20240618/24531.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。