音频质量评估方法及相关产品与流程
- 国知局
- 2024-06-21 11:30:35
本技术涉及音频处理,尤其涉及一种音频质量评估方法及相关产品。
背景技术:
1、音频质量评估是音频处理中的基本技术之一,被广泛应用于音频处理领域中,因此,如何对音频的质量进行评估具有非常重要的意义。
技术实现思路
1、本技术提供一种音频质量评估方法及相关产品,其中,相关产品包括音频质量评估装置、电子设备、计算机可读存储介质、计算机程序产品。
2、第一方面,提供了一种音频质量评估方法,所述方法包括:
3、获取原始音频和待评估音频,所述待评估音频是通过对所述原始音频进行音频处理得到的;
4、将所述原始音频分为n帧第一音频帧,所述n为大于1的整数;
5、将所述待评估音频分为n帧第二音频帧;
6、根据所述n帧第一音频帧的时域信息与所述n帧第二音频帧的时域信息的第一差异,确定所述待评估音频的质量,所述待评估音频的质量与所述第一差异呈负相关。
7、结合本技术任一实施方式,在根据所述n帧第一音频帧的时域信息与所述n帧第二音频帧的时域信息的第一差异,确定所述待评估音频的质量之前,所述方法还包括:
8、根据所述n帧第一音频帧和所述n帧第二音频帧中相同位置的音频帧的第二差异,得到所述待评估音频的n个短时评分,所述待评估音频的质量与所述第二差异呈负相关,所述短时评分表征所述待评估音频的质量;
9、所述根据所述n帧第一音频帧的时域信息与所述n帧第二音频帧的时域信息的第一差异,确定所述待评估音频的质量,包括:
10、根据所述n帧第一音频帧的时域信息与所述n帧第二音频帧的时域信息的第一差异,得到所述待评估音频的长时评分,所述长时评分表征所述待评估音频的质量;
11、根据所述n个短时评分和所述长时评分,确定所述待评估音频的质量。
12、结合本技术任一实施方式,所述根据所述n帧第一音频帧的时域信息与所述n帧第二音频帧的时域信息的第一差异,得到所述待评估音频的长时评分,包括:
13、对所述n帧第一音频帧进行特征提取处理,得到所述n帧第一音频帧的n个第一特征值;
14、对所述n帧第二音频帧进行特征提取处理,得到所述n帧第二音频帧的n个第二特征值;
15、根据所述n个第一特征值的时域信息与所述n个第二特征值的时域信息的第三差异,得到所述长时评分,所述待评估音频的质量与所述第三差异呈负相关。
16、结合本技术任一实施方式,所述根据所述n个短时评分和所述长时评分,确定所述待评估音频的质量,包括:
17、计算所述n个短时评分的方差;
18、根据所述方差,确定所述待评估音频的稳定性评分,所述稳定性评分表征所述待评估音频的质量的稳定性;
19、根据所述稳定性评分和所述长时评分,确定所述待评估音频的质量。
20、结合本技术任一实施方式,所述根据所述n个短时评分和所述长时评分,确定所述待评估音频的质量,包括:
21、计算所述n个短时评分的平均值;
22、根据所述平均值和所述长时评分,确定所述待评估音频的质量。
23、结合本技术任一实施方式,所述根据所述n个短时评分和所述长时评分,确定所述待评估音频的质量,包括:
24、计算所述n个短时评分的最值;
25、根据所述最值和所述长时评分,确定所述待评估音频的质量。
26、结合本技术任一实施方式,所述将所述待评估音频分为n帧第二音频帧,包括:
27、将所述待评估音频向所述原始音频对齐,得到已对齐音频;
28、通过将所述已对齐音频分为n帧,得到所述n帧第二音频帧。
29、结合本技术任一实施方式,所述音频质量评估方法应用于音频质量评估装置,所述音频质量评估装置运行音频点播平台,所述待评估音频为需要发布至所述音频点播平台的音频;
30、在确定所述待评估音频的质量之后,所述方法还包括:
31、根据所述待评估音频的质量,确定所述待评估音频在所述音频点播平台的处理策略。
32、结合本技术任一实施方式,所述根据所述待评估音频的质量,确定所述待评估音频在所述音频点播平台的处理策略,包括:
33、在所述待评估音频的质量达到高质量阈值的情况下,对所述待评估音频执行目标操作,所述目标操作包括以下中的一个或一个以上:下发至所述音频点播平台、在所述音频点播平台上推送;
34、在所述待评估音频的质量未达到低质量阈值的情况下,输出告警信息,所述告警信息指示所述待评估音频的质量低于所述音频点播平台的质量要求;
35、在所述待评估音频的质量未达到所述低质量阈值的情况下,在基准推送量的基础上减少推送量得到所述待评估音频的目标推送量,所述基准推送量为在音频的质量达到所述质量阈值的情况下的推送量;
36、在所述待评估音频的质量达到所述低质量阈值且未达到所述高质量阈值的情况下,确定所述待评估音频为待监测音频,所述待监测为需要人工审核的音频。
37、第二方面,提供了一种音频质量评估装置,所述装置包括:
38、获取单元,用于获取原始音频和待评估音频,所述待评估音频是通过对所述原始音频进行音频处理得到的;
39、划分单元,用于将所述原始音频分为n帧第一音频帧,所述n为大于1的整数;
40、所述划分单元,用于将所述待评估音频分为n帧第二音频帧;
41、确定单元,用于根据所述n帧第一音频帧的时域信息与所述n帧第二音频帧的时域信息的第一差异,确定所述待评估音频的质量,所述待评估音频的质量与所述第一差异呈负相关。
42、结合本技术任一实施方式,所述装置,还包括:处理单元,用于根据所述n帧第一音频帧和所述n帧第二音频帧中相同位置的音频帧的第二差异,得到所述待评估音频的n个短时评分,所述待评估音频的质量与所述第二差异呈负相关,所述短时评分表征所述待评估音频的质量;
43、所述确定单元,用于:
44、根据所述n帧第一音频帧的时域信息与所述n帧第二音频帧的时域信息的第一差异,得到所述待评估音频的长时评分,所述长时评分表征所述待评估音频的质量;
45、根据所述n个短时评分和所述长时评分,确定所述待评估音频的质量。
46、结合本技术任一实施方式,所述确定单元,用于:
47、对所述n帧第一音频帧进行特征提取处理,得到所述n帧第一音频帧的n个第一特征值;
48、对所述n帧第二音频帧进行特征提取处理,得到所述n帧第二音频帧的n个第二特征值;
49、根据所述n个第一特征值的时域信息与所述n个第二特征值的时域信息的第三差异,得到所述长时评分,所述待评估音频的质量与所述第三差异呈负相关。
50、结合本技术任一实施方式,所述确定单元,用于:
51、计算所述n个短时评分的方差;
52、根据所述方差,确定所述待评估音频的稳定性评分,所述稳定性评分表征所述待评估音频的质量的稳定性;
53、根据所述稳定性评分和所述长时评分,确定所述待评估音频的质量。
54、结合本技术任一实施方式,所述确定单元,用于:
55、计算所述n个短时评分的平均值;
56、根据所述平均值和所述长时评分,确定所述待评估音频的质量。
57、结合本技术任一实施方式,所述确定单元,用于:
58、计算所述n个短时评分的最值;
59、根据所述最值和所述长时评分,确定所述待评估音频的质量。
60、结合本技术任一实施方式,所述划分单元,用于:
61、将所述待评估音频向所述原始音频对齐,得到已对齐音频;
62、通过将所述已对齐音频分为n帧,得到所述n帧第二音频帧。
63、结合本技术任一实施方式,所述音频质量评估装置运行音频点播平台,所述待评估音频为需要发布至所述音频点播平台的音频;
64、所述确定单元,还用于根据所述待评估音频的质量,确定所述待评估音频在所述音频点播平台的处理策略。
65、结合本技术任一实施方式,所述确定单元,用于:
66、在所述待评估音频的质量达到高质量阈值的情况下,对所述待评估音频执行目标操作,所述目标操作包括以下中的一个或一个以上:下发至所述音频点播平台、在所述音频点播平台上推送;
67、在所述待评估音频的质量未达到低质量阈值的情况下,输出告警信息,所述告警信息指示所述待评估音频的质量低于所述音频点播平台的质量要求;
68、在所述待评估音频的质量未达到所述低质量阈值的情况下,在基准推送量的基础上减少推送量得到所述待评估音频的目标推送量,所述基准推送量为在音频的质量达到所述质量阈值的情况下的推送量;
69、在所述待评估音频的质量达到所述低质量阈值且未达到所述高质量阈值的情况下,确定所述待评估音频为待监测音频,所述待监测为需要人工审核的音频。
70、第三方面,提供了一种电子设备,包括:处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任意一种可能实现的方式的方法。
71、第四方面,提供了另一种电子设备,包括:处理器、发送装置、输入装置、输出装置和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任一实施方式。
72、第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,在所述程序指令被处理器执行的情况下,使所述处理器执行如上述第一方面及其任一实施方式。
73、第六方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序或指令,在所述计算机程序或指令在计算机上运行的情况下,使得所述计算机执行上述第一方面及其任一实施方式。
74、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本技术。
75、本技术中,待评估音频是通过对原始音频进行音频处理得到的,音频质量评估装置在获取原始音频和待评估音频后,将原始音频分为n帧第一音频帧,将待评估音频分为n帧第二音频帧。这样,n帧第一音频帧的时间信息包括n帧第一音频帧所携带的信息的时序变化,n帧第二音频帧的时间信息包括n帧第二音频帧所携带的信息的时序变化,n帧第一音频帧的时域信息与n帧第二音频帧的时域信息的第一差异,可表征原始音频所携带的信息的时序变化与待评估音频所携带的信息的时序变化的差异。因此,音频质量评估装置可在待评估音频的质量与第一差异呈负相关的情况下,根据第一差异确定待评估音频的质量,由此,提升待评估音频的质量的准确度。
本文地址:https://www.jishuxx.com/zhuanli/20240618/21959.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。