技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音阶评分方法、装置、计算机设备和存储介质与流程 > 正文

音阶评分方法、装置、计算机设备和存储介质与流程

国知局
2024-06-21 11:30:37

本技术涉及语音处理，特别是涉及一种音阶评分方法、装置、计算机设备、存储介质和计算机程序产品。

背景技术：

1、在音乐教学中，老师需要通过人工改卷对学生的学习成果进行客观、准确的评估，该方法依赖于教师的个人听感和主观判断，因此方法效率低，且主观性强，容易受到个人情感和偏见的影响。

2、相关技术中，老师可以通过评分系统对待评分音频进行打分，评分系统基于老师录制的评分模板，分析待评分音频的音阶、旋律等基本特征，得到自动评估后的音阶评分，但是待评分音频是由学生作为演唱者演唱得到的，待评分音频与老师的评分模板存在时间差距，导致评分系统对待评分音频评分时音阶评分的准确率不足。

技术实现思路

1、基于此，有必要针对上述技术问题，提供一种音阶评分方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面，本技术提供了一种音阶评分方法。所述方法包括：

3、获取待评分音频对应的初始频率数据，并对所述初始频率数据进行平滑处理，得到平滑频率数据；

4、将所述待评分音频输入训练好的歌词对齐模型，得到所述待评分音频中歌词对应的时间序列，并将所述平滑频率数据与所述歌词对应的时间序列合并，得到所述待评分音频对应的第一对齐频率数据；所述歌词对应的时间序列中包含音素和所述音素对应的时间戳；

5、基于模板音频的第二对齐频率数据中所述歌词的区间长度，将所述第一对齐频率数据中所述歌词的区间长度进行等比缩放，得到所述待评分音频对应缩放后的缩放频率数据；所述缩放频率数据中各歌词的区间长度与所述第二对齐频率数据中对应歌词的区间长度相同；

6、确定所述第二对齐频率数据对应的频率范围，并根据所述缩放频率数据与所述频率范围的匹配度，确定所述缩放频率数据对应的音阶评分，作为所述待评分音频的音阶评分。

7、在其中一个实施例中，所述获取待评分音频对应的初始频率数据，并对所述初始频率数据进行平滑处理，得到平滑频率数据，包括：

8、对所述待评分音频采样，得到所述待评分音频对应的初始频率数据；

9、针对所述初始频率数据的每个当前索引的频率值，确定所述频率值对应的相似区间；所述相似区间是由与所述当前索引对应的频率上下限相匹配的多个索引确定的，所述频率上下限是所述当前索引的上一个索引对应的频率值的取值范围；

10、确定所述相似区间中各索引的频率值对应的众数，基于所述众数更新所述相似区间中各索引的频率值，得到平滑后的频率值；

11、在完成对所述初始频率数据中各索引的频率值的遍历之后，得到所述平滑频率数据。

12、在其中一个实施例中，所述基于模板音频的第二对齐频率数据中所述歌词的区间长度，将所述第一对齐频率数据中所述歌词的区间长度进行等比缩放，得到所述待评分音频对应缩放后的缩放频率数据，包括：

13、针对所述第一对齐频率数据的每个歌词，确定所述歌词对应的第一频率数组，以及所述第二对齐音频数据中与所述歌词相匹配的第二频率数组；

14、获取所述第一频率数组中相同的频率值在所述第一频率数组中的数量占比；

15、根据所述第二频率数组的区间长度以及各频率值的所述数量占比，对所述第一频率数组中各频率值的数量进行等比缩放，使得所述歌词对应的缩放后的第一频率数组的区间长度与所述第二频率数组的区间长度相同；

16、在完成对所述第一对齐频率数据中各歌词的遍历之后，得到缩放后的缩放频率数据。

17、在其中一个实施例中，所述确定所述第二对齐频率数据对应的频率范围，并根据所述缩放频率数据与所述频率范围的匹配度，确定所述缩放频率数据对应的音阶评分，包括：

18、针对所述缩放频率数据包含的每个第一频率数组，基于预设的范围系数与所述第二频率数组中各频率值的乘积，确定所述第二频率数组对应的频率范围数组；第一频率数组的频率值和所述频率范围组中的范围区间一一对应；

19、若所述第一频率数组的频率值不在所述频率范围组的范围区间内，则得到所述频率值对应的扣分值，并基于所述第一频率数组的总分值与各所述扣分值的差值，得到所述第一频率数组对应歌词的得分值；所述扣分值是通过第一频率数组中各频率值的占比确定的；

20、在完成对所述缩放频率数据的各第一频率数组的遍历后，得到多个所述歌词的得分值，将多个所述歌词的得分值求和，得到所述待评分音频对应的音阶评分。

21、在其中一个实施例中，所述方法还包括：

22、获取用户端上传的训练数据集，所述训练数据集包含训练音频以及所述训练音频对应的训练歌词；

23、将所述训练数据集输入至预训练模型，通过mfa模型对所述预训练模型进行训练，得到训练好的歌词对齐模型；其中，所述预训练模型是基于预设的音素语料库确定的模型，所述音素语料库中包含多个音阶以及每个音阶的多种发音信息。

24、在其中一个实施例中，所述方法还包括：

25、将用户端上传的模板音频输入所述训练好的歌词对齐模型，得到所述模板音频中歌词的时间序列；

26、将所述模板音频中歌词的时间序列与所述模板音频的频率数据合并，得到所述模板音频的第二对齐频率数据，并将所述第二对齐频率数据存储至数据库。

27、第二方面，本技术还提供了一种音阶评分装置。所述装置包括：

28、频率平滑模块，用于获取待评分音频对应的初始频率数据，并对所述初始频率数据进行平滑处理，得到平滑频率数据；

29、音频对齐模块，用于将所述待评分音频输入训练好的歌词对齐模型，得到所述待评分音频中歌词对应的时间序列，并将所述平滑频率数据与所述歌词对应的时间序列合并，得到所述待评分音频对应的第一对齐频率数据；所述歌词对应的时间序列中包含音素和所述音素对应的时间戳；

30、音频缩放模块，用于基于模板音频的第二对齐频率数据中所述歌词的区间长度，将所述第一对齐频率数据中所述歌词的区间长度进行等比缩放，得到所述待评分音频对应缩放后的缩放频率数据；所述缩放频率数据中各歌词的区间长度与所述第二对齐频率数据中对应歌词的区间长度相同；

31、音频评分模块，用于确定所述第二对齐频率数据对应的频率范围，并根据所述缩放频率数据与所述频率范围的匹配度，确定所述缩放频率数据对应的音阶评分，作为所述待评分音频的音阶评分。

32、第三方面，本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器，所述存储器存储有计算机程序，所述处理器执行所述计算机程序时实现如第一方面所述方法的步骤。

33、第四方面，本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质，其上存储有计算机程序，所述计算机程序被处理器执行时实现如第一方面所述方法的步骤。

34、第五方面，本技术还提供了一种计算机程序产品。所述计算机程序产品，包括计算机程序，该计算机程序被处理器执行时实现如第一方面所述方法的步骤。

35、上述音阶评分方法、装置、计算机设备、存储介质和计算机程序产品，通过对待评分音频的频率数据进行平滑处理，得到待评分音频的平滑频率数据，平滑频率数据可以使音频清晰和平稳，提升待评分音频的音频质量。服务器将待评分音频输入至歌词对齐模型，得到高精准度的时间序列。服务器将平滑频率数据和待评分音频的歌词对应时间序列合并，得到第一对齐频率数据，即得到歌词对应的音素、音素的频率数据，以及音素的时间戳，通过上述的音频处理技术手段，能够得到具有高精度的歌词对齐数据和音频频率数据，从而使后续的步骤能够基于高精度的数据进行音阶评分。基于此，服务器将模板音频对应的第二对齐频率数据中各歌词的区间长度作为样本，将第一对齐频率数据中对应歌词的区间长度进行缩小或放大，以使第一对齐频率数据中歌词的区间长度和第二对齐频率数据中歌词的区间长度相同，使得第一对齐频率数据的歌词与第二对齐频率数据的歌词全部相匹配。基于此，服务器通过第二对齐频率对应的频率范围，对缩放后的缩放频率数据进行匹配，确定待评分音频的音阶评分，能够灵活地调整音频评分标准。综上所述，该音阶评分方法可以通过获取高精度的歌词对齐数据和音频频率数据，通过歌词完全匹配的第一对齐频率数据和第二对齐频率数据，以及通过灵活的频率范围对待评分音频进行评分，从而提升对待评分音频的音阶评分的准确率。