音频处理方法及装置、电子设备及计算机可读存储介质与流程
- 国知局
- 2024-06-21 11:36:52
本技术涉及音频处理,尤其涉及一种音频处理方法及装置、电子设备及计算机可读存储介质。
背景技术:
1、在实际应用中,为满足需求通常需要使用音频处理算法对音频进行处理,因此,如何评估音频处理算法的处理效果具有非常重要的意义。
技术实现思路
1、本技术提供一种音频处理方法及装置、电子设备及计算机可读存储介质。
2、第一方面,提供了一种音频处理方法,所述方法包括:
3、获取第一待测音频和目标音频处理算法;
4、利用目标音频处理算法对所述第一待测音频进行处理,得到第一结果数据,所述第一结果数据包括第一结果音频,所述第一结果音频为利用所述目标音频处理算法对所述第一待测音频进行处理得到的音频;
5、根据所述第一结果音频中的语音,确定所述目标音频处理算法对语音的处理效果,得到第一评测结果;
6、根据所述第一结果数据中的非语音数据确定所述目标音频处理算法对音频的处理效果,得到第二评测结果;
7、根据所述第一评测结果和所述第二评测结果,确定所述目标音频处理算法对音频的处理效果。
8、结合本技术任一实施方式,所述根据所述第一结果数据中的非语音数据确定所述目标音频处理算法对音频的处理效果,得到第二评测结果,包括:
9、通过对所述第一结果音频的声学特征进行检测,得到所述第一结果音频的声学特征;
10、根据所述声学特征,得到所述第二评测结果。
11、结合本技术任一实施方式,所述声学特征包括声压级、响度中的一个或一个以上;
12、所述根据所述声学特征,得到所述第二评测结果,包括:
13、在所述声学特征包括声压级的情况下,根据所述声压级的最大值和所述声压级的最小值,确定声压级动态范围,所述声压级动态范围为所述第一结果音频的声压级的动态范围;
14、根据所述声压级动态范围,得到所述第二评测结果;
15、在所述声学特征包括响度的情况下,根据所述响度的最大值和所述响度的最小值,确定响度动态范围,所述响度动态范围为所述第一结果音频的响度的动态范围;
16、根据所述响度动态范围,得到所述第二评测结果。
17、结合本技术任一实施方式,所述非语音数据包括目标时长、目标计算量中的一个或一个以上,所述目标时长表征所述目标音频处理算法得到所述第一结果音频所消耗的时间,所述目标计算量为通过所述目标音频处理算法得到所述第一结果音频所产生的计算量;
18、所述根据所述第一结果数据中的非语音数据确定所述目标音频处理算法对音频的处理效果,得到第二评测结果,包括:
19、在所述非语音数据包括所述时间的情况下,根据所述时间确定所述第二评测结果;
20、在所述非语音数据包括所述计算量的情况下,根据所述计算量确定所述第二评测结果。
21、结合本技术任一实施方式,所述根据所述第一结果音频中的语音,确定所述目标音频处理算法对语音的处理效果,得到第一评测结果,包括:
22、确定所述第一结果音频中的语音的质量;
23、根据所述质量,确定所述目标音频处理算法对语音的处理效果,得到所述第一评测结果;
24、或者,确定所述第一结果音频中的语音的语音可懂度;
25、根据所述语音可懂度,确定所述目标音频处理算法对语音的处理效果,得到所述第一评测结果。
26、结合本技术任一实施方式,在所述根据所述第一结果音频中的语音,确定所述目标音频处理算法对语音的处理效果,得到第一评测结果之前,所述方法还包括:
27、获取语音音频,所述语音音频为包括语音的音频,所述第一待测音频是基于所述语音音频得到的音频;
28、所述根据所述第一结果音频中的语音,确定所述目标音频处理算法对语音的处理效果,得到第一评测结果,包括:
29、在所述语音音频的能量小于所述第一结果音频的能量的情况下,确定所述第一评测结果包括:经过所述目标音频处理算法对所述第一待测音频的处理,所述第一结果音频中残留有所述第一待测音频中的噪声;
30、在所述语音音频的能量大于所述第一结果音频的能量的情况下,确定所述第一评测结果包括:经过所述目标音频处理算法对所述第一待测音频的处理,所述第一待测音频中语音存在失真。
31、结合本技术任一实施方式,所述获取第一待测音频,包括:
32、获取音乐音频,所述音乐音频中的声音为音乐;
33、通过对所述语音音频、所述音乐音频和噪声进行混合,得到满足预设要求的音频,作为所述第一待测音频。
34、结合本技术任一实施方式,所述根据所述第一评测结果和所述第二评测结果,确定所述目标音频处理算法对音频的处理效果,包括:
35、获取第一参考范围和第二参考范围,所述第一参考范围为所述第一评测结果的正常范围,所述第二参考范围为所述第二评测结果的正常范围;
36、在所述第一评测结果处于所述第一参考范围外,或所述第二评测结果处于所述第二参考范围外的情况下,确定所述目标音频处理算法对音频的处理效果包括,所述目标音频处理算法对目标类音频的处理出现异常,所述目标类音频为满足所述预设要求的音频。
37、结合本技术任一实施方式,所述获取第一参考范围,包括:
38、获取至少一个第三评测结果,所述第三评测结果为根据第二结果音频中的语音,确定所述目标音频处理算法对语音的处理效果得到的结果,所述第二结果音频是经过所述目标音频处理算法对第二待测音频进行处理得到的音频,所述第一待测音频与所述第二待测音频不同;所述第三评测结果或为根据第三结果音频中的语音,确定第一待评测音频处理算法得到的结果,所述第三结果音频是经过所述第一待评测音频处理算法对音频进行处理得到的音频;
39、按从大到小的顺序排列对所述第一评测结果与所述至少一个第三评测结果进行排列,得到排列结果;
40、根据所述排列结果中的第一预设分位和所述排列结果中的第二预设分位,确定所述第一参考范围。
41、结合本技术任一实施方式,所述根据所述排列结果中的第一预设分位和所述排列结果中的第二预设分位,确定所述第一参考范围,包括:
42、从所述排列结果中确定与所述第一预设分位对应的第一参考值;
43、从所述排列结果中确定与所述第二预设分位对应的第二参考值;
44、根据所述第一参考值和所述第二参考值,确定所述第一参考范围。
45、结合本技术任一实施方式,所述根据所述第一评测结果和所述第二评测结果,确定所述目标音频处理算法对音频的处理效果,包括:
46、获取第四评测结果和第五评测结果,所述第四评测结果是根据第四结果音频中的语音,确定第二待评测音频处理算法对语音的处理效果得到的结果,所述第四结果音频通过利用所述第二待评测音频处理算法对所述第一待测音频进行处理得到的音频,所述第二待评测音频处理算法与所述目标音频处理算法不同;所述第五评测结果是根据第二结果数据中的所述非语音数据,确定所述第二待评测音频处理算法对音频的处理效果得到的结果,所述第二结果数据通过利用所述第二待评测音频处理算法对所述第一待测音频进行处理得到;
47、对所述第一评测结果和所述第四评测结果进行聚合,得到第一聚合结果;
48、对所述第二评测结果和所述第五评测结果进行聚合,得到第二聚合结果;
49、根据所述第一聚合结果和所述第二聚合结果,确定所述目标音频处理算法的处理效果与所述第二待评测音频处理算法的处理效果的差异。
50、结合本技术任一实施方式,所述根据所述第一评测结果和所述第二评测结果,确定所述目标音频处理算法对音频的处理效果,包括:
51、获取第六评测结果和第七评测结果,所述第六评测结果是根据第五结果音频中的语音,确定所述目标音频处理算法对语音的处理效果得到的结果,所述第五结果音频通过利用所述目标音频处理算法对第二待测音频进行处理得到,所述第二待测音频与所述第一待测音频不同;所述第七评测结果是根据第三结果数据中的非语音数据,确定所述目标音频处理算法对音频的处理效果得到的结果,所述第三结果数据通过利用所述目标音频处理算法对所述第二待测音频进行处理得到;
52、对所述第一评测结果和所述第六评测结果进行聚合,得到第三聚合结果;
53、对所述第二评测结果和所述第七评测结果进行聚合,得到第四聚合结果;
54、根据所述第三聚合结果和所述第四聚合结果,确定所述目标音频处理算法对不同音频的处理效果。
55、结合本技术任一实施方式,所述根据所述第一评测结果和所述第二评测结果,确定所述目标音频处理算法对音频的处理效果,包括:
56、在所述第一评测结果的数量大于1的情况下,对所述第一评测结果进行加权融合,得到第八评测结果;
57、根据所述第八评测结果和所述第二评测结果,确定所述目标音频处理算法对音频的处理效果;
58、或者,在所述第二评测结果的数量大于1的情况下,对所述第二评测结果进行加权融合,得到第九评测结果;
59、根据所述第一评测结果和所述第八评测结果,确定所述目标音频处理算法对音频的处理效果。
60、结合本技术任一实施方式,获取目标音频处理算法,包括:
61、获取所述目标音频处理算法的目标配置参数,所述目标配置参数包括获得目标音频处理算法所需的至少一个候选音频处理算法、所述至少一个候选音频处理算法之间的耦合关系、所述至少一个候选音频处理算法的至少一个候选配置参数;
62、根据所述至少一个候选配置参数和所述耦合关系,对所述至少一个候选音频处理算法进行配置,得到所述目标音频处理算法。
63、第二方面,提供了一种音频处理装置,所述音频处理装置包括:
64、获取单元,用于获取第一待测音频和目标音频处理算法;
65、处理单元,用于利用目标音频处理算法对所述第一待测音频进行处理,得到第一结果数据,所述第一结果数据包括第一结果音频,所述第一结果音频为利用所述目标音频处理算法对所述第一待测音频进行处理得到的音频;
66、确定单元,用于根据所述第一结果音频中的语音,确定所述目标音频处理算法对语音的处理效果,得到第一评测结果;
67、所述确定单元,用于根据所述第一结果数据中的非语音数据确定所述目标音频处理算法对音频的处理效果,得到第二评测结果;
68、所述确定单元,用于根据所述第一评测结果和所述第二评测结果,确定所述目标音频处理算法对音频的处理效果。
69、结合本技术任一实施方式,所述确定单元,具体用于:
70、通过对所述第一结果音频的声学特征进行检测,得到所述第一结果音频的声学特征;
71、根据所述声学特征,得到所述第二评测结果。
72、结合本技术任一实施方式,所述声学特征包括声压级、响度中的一个或一个以上;
73、所述确定单元,具体用于:
74、在所述声学特征包括声压级的情况下,根据所述声压级的最大值和所述声压级的最小值,确定声压级动态范围,所述声压级动态范围为所述第一结果音频的声压级的动态范围;
75、根据所述声压级动态范围,得到所述第二评测结果;
76、在所述声学特征包括响度的情况下,根据所述响度的最大值和所述响度的最小值,确定响度动态范围,所述响度动态范围为所述第一结果音频的响度的动态范围;
77、根据所述响度动态范围,得到所述第二评测结果。
78、结合本技术任一实施方式,所述非语音数据包括目标时长、目标计算量中的一个或一个以上,所述目标时长表征所述目标音频处理算法得到所述第一结果音频所消耗的时间,所述目标计算量为通过所述目标音频处理算法得到所述第一结果音频所产生的计算量;
79、所述确定单元,具体用于:
80、在所述非语音数据包括所述时间的情况下,根据所述时间确定所述第二评测结果;
81、在所述非语音数据包括所述计算量的情况下,根据所述计算量确定所述第二评测结果。
82、结合本技术任一实施方式,所述确定单元,具体用于:
83、确定所述第一结果音频中的语音的质量;
84、根据所述质量,确定所述目标音频处理算法对语音的处理效果,得到所述第一评测结果;
85、或者,确定所述第一结果音频中的语音的语音可懂度;
86、根据所述语音可懂度,确定所述目标音频处理算法对语音的处理效果,得到所述第一评测结果。
87、结合本技术任一实施方式,所述获取单元,还用于获取语音音频,所述语音音频为包括语音的音频,所述第一待测音频是基于所述语音音频得到的音频;
88、所述确定单元,具体用于:
89、在所述语音音频的能量小于所述第一结果音频的能量的情况下,确定所述第一评测结果包括:经过所述目标音频处理算法对所述第一待测音频的处理,所述第一结果音频中残留有所述第一待测音频中的噪声;
90、在所述语音音频的能量大于所述第一结果音频的能量的情况下,确定所述第一评测结果包括:经过所述目标音频处理算法对所述第一待测音频的处理,所述第一待测音频中语音存在失真。
91、结合本技术任一实施方式,所述获取单元,具体用于:
92、获取音乐音频,所述音乐音频中的声音为音乐;
93、通过对所述语音音频、所述音乐音频和噪声进行混合,得到满足预设要求的音频,作为所述第一待测音频。
94、结合本技术任一实施方式,所述确定单元,具体用于:
95、获取第一参考范围和第二参考范围,所述第一参考范围为所述第一评测结果的正常范围,所述第二参考范围为所述第二评测结果的正常范围;
96、在所述第一评测结果处于所述第一参考范围外,或所述第二评测结果处于所述第二参考范围外的情况下,确定所述目标音频处理算法对音频的处理效果包括,所述目标音频处理算法对目标类音频的处理出现异常,所述目标类音频为满足所述预设要求的音频。
97、结合本技术任一实施方式,所述获取单元,具体用于:
98、获取至少一个第三评测结果,所述第三评测结果为根据第二结果音频中的语音,确定所述目标音频处理算法对语音的处理效果得到的结果,所述第二结果音频是经过所述目标音频处理算法对第二待测音频进行处理得到的音频,所述第一待测音频与所述第二待测音频不同;所述第三评测结果或为根据第三结果音频中的语音,确定第一待评测音频处理算法得到的结果,所述第三结果音频是经过所述第一待评测音频处理算法对音频进行处理得到的音频;
99、按从大到小的顺序排列对所述第一评测结果与所述至少一个第三评测结果进行排列,得到排列结果;
100、根据所述排列结果中的第一预设分位和所述排列结果中的第二预设分位,确定所述第一参考范围。
101、结合本技术任一实施方式,所述确定单元,具体用于:
102、从所述排列结果中确定与所述第一预设分位对应的第一参考值;
103、从所述排列结果中确定与所述第二预设分位对应的第二参考值;
104、根据所述第一参考值和所述第二参考值,确定所述第一参考范围。
105、结合本技术任一实施方式,所述确定单元,具体用于:
106、获取第四评测结果和第五评测结果,所述第四评测结果是根据第四结果音频中的语音,确定第二待评测音频处理算法对语音的处理效果得到的结果,所述第四结果音频通过利用所述第二待评测音频处理算法对所述第一待测音频进行处理得到的音频,所述第二待评测音频处理算法与所述目标音频处理算法不同;所述第五评测结果是根据第二结果数据中的所述非语音数据,确定所述第二待评测音频处理算法对音频的处理效果得到的结果,所述第二结果数据通过利用所述第二待评测音频处理算法对所述第一待测音频进行处理得到;
107、对所述第一评测结果和所述第四评测结果进行聚合,得到第一聚合结果;
108、对所述第二评测结果和所述第五评测结果进行聚合,得到第二聚合结果;
109、根据所述第一聚合结果和所述第二聚合结果,确定所述目标音频处理算法的处理效果与所述第二待评测音频处理算法的处理效果的差异。
110、结合本技术任一实施方式,所述确定单元,具体用于:
111、获取第六评测结果和第七评测结果,所述第六评测结果是根据第五结果音频中的语音,确定所述目标音频处理算法对语音的处理效果得到的结果,所述第五结果音频通过利用所述目标音频处理算法对第二待测音频进行处理得到,所述第二待测音频与所述第一待测音频不同;所述第七评测结果是根据第三结果数据中的非语音数据,确定所述目标音频处理算法对音频的处理效果得到的结果,所述第三结果数据通过利用所述目标音频处理算法对所述第二待测音频进行处理得到;
112、对所述第一评测结果和所述第六评测结果进行聚合,得到第三聚合结果;
113、对所述第二评测结果和所述第七评测结果进行聚合,得到第四聚合结果;
114、根据所述第三聚合结果和所述第四聚合结果,确定所述目标音频处理算法对不同音频的处理效果。
115、结合本技术任一实施方式,所述确定单元,具体用于:
116、在所述第一评测结果的数量大于1的情况下,对所述第一评测结果进行加权融合,得到第八评测结果;
117、根据所述第八评测结果和所述第二评测结果,确定所述目标音频处理算法对音频的处理效果;
118、或者,在所述第二评测结果的数量大于1的情况下,对所述第二评测结果进行加权融合,得到第九评测结果;
119、根据所述第一评测结果和所述第八评测结果,确定所述目标音频处理算法对音频的处理效果。
120、结合本技术任一实施方式,所述获取单元,具体用于:
121、获取所述目标音频处理算法的目标配置参数,所述目标配置参数包括获得目标音频处理算法所需的至少一个候选音频处理算法、所述至少一个候选音频处理算法之间的耦合关系、所述至少一个候选音频处理算法的至少一个候选配置参数;
122、根据所述至少一个候选配置参数和所述耦合关系,对所述至少一个候选音频处理算法进行配置,得到所述目标音频处理算法。
123、第三方面,提供了一种电子设备,包括:处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任意一种可能实现的方式的方法。
124、第四方面,提供了另一种电子设备,包括:处理器、发送装置、输入装置、输出装置和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任一实施方式。
125、第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,在所述程序指令被处理器执行的情况下,使所述处理器执行如上述第一方面及其任一实施方式。
126、第六方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序或指令,在所述计算机程序或指令在计算机上运行的情况下,使得所述计算机执行上述第一方面及其任一实施方式。
127、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本技术。
128、本技术中,音频处理装置在获取第一待测音频和目标音频处理算法后,利用目标音频处理算法对第一待测音频进行处理,得到第一结果数据,其中,第一结果数据包括利用目标音频处理算法对第一待测音频进行处理得到的第一结果音频。音频处理装置再根据第一结果音频中的语音,确定目标音频处理算法对语音的处理效果,得到第一评测结果,根据第一结果数据中的非语音数据确定目标音频处理算法对音频的处理效果,得到第二评测结果。最后根据第一评测结果和第二评测结果,确定目标音频处理算法对音频的处理效果,可实现以第一结果数据中的语音和第一结果数据中的非语音数据为依据,确定目标音频处理算法对音频的处理效果,从而可提升对目标音频处理算法对音频的处理效果的评估准确度。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22425.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。