音频处理方法及装置、电子设备及计算机可读存储介质与流程
- 国知局
- 2024-06-21 11:37:17
本技术涉及音频处理,尤其涉及一种音频处理方法及装置、电子设备及计算机可读存储介质。
背景技术:
1、为提高音频的质量,通常需要使用信号处理算法对音频进行处理,这样信号处理算法对音频的处理效果将直接决定处理后的音频的质量。因此,评估信号处理算法对音频的处理效果具有非常重要的意义。
2、在目前的技术中,通常是直接根据信号处理算法处理前的音频的质量与经信号处理算法处理后的音频的质量,评估信号处理算法对音频的处理效果,如基于处理前的音频的信噪比和处理后的音频的信噪比的差异,评估音频处理算法的处理效果。但通过该种方法确定的评估结果的准确度低。
技术实现思路
1、本技术提供一种音频处理方法及装置、电子设备及计算机可读存储介质。
2、第一方面,提供了一种音频处理方法,所述方法包括:
3、获取目标音频,所述目标音频为原始音频经过目标信号处理算法处理后得到的音频,所述目标音频包括第一非噪声信号,所述原始音频包括第二非噪声信号;
4、根据所述目标音频,得到所述第一非噪声信号的第一非噪声增益;
5、获取所述第二非噪声信号的第二非噪声增益;
6、基于所述第一非噪声增益和所述第二非噪声增益的差异,确定所述目标信号处理算法的非噪声信号处理指标,所述非噪声信号处理指标表征所述目标信号处理算法对音频中的非噪声信号的处理效果。
7、结合本技术任一实施方式,所述根据所述目标音频,得到所述第一非噪声信号的第一非噪声增益,包括:
8、将所述目标音频分为n段第一音频帧;
9、根据所述n段第一音频帧,得到所述n段第一音频帧中的非噪声信号的n个第三非噪声增益,作为所述第一非噪声增益,所述第三非噪声增益与所述第一音频帧一一对应。
10、结合本技术任一实施方式,所述获取目标音频,包括:
11、获取所述目标信号处理算法、所述第二非噪声信号和原始噪声信号;
12、对所述第二非噪声信号和所述原始噪声信号进行融合,得到所述原始音频;
13、使用所述目标信号处理算法对所述原始音频进行处理,得到所述目标音频。
14、结合本技术任一实施方式,所述将所述目标音频分为n段第一音频帧,包括:
15、对所述目标音频与所述第二非噪声信号进行对齐,得到已对齐目标音频;
16、将所述已对齐目标音频分为n段音频帧,得到所述n段第一音频帧。
17、结合本技术任一实施方式,所述原始音频包括n段第二音频帧,所述第一音频帧与所述第二音频帧一一对应;所述第二非噪声增益包括n个第四非噪声增益,所述n个第四非噪声增益为所述n段第二音频帧中的非噪声信号的增益;
18、所述基于所述第一非噪声增益和所述第二非噪声增益的差异,确定所述目标信号处理算法的非噪声信号处理指标,包括:
19、分别确定所述n个第三非噪声增益与所述n个第四非噪声增益中相对应的两个增益的差值,得到n个第一差值;
20、根据所述n个第一差值,确定所述目标信号处理算法的非噪声信号处理指标。
21、结合本技术任一实施方式,所述非噪声信号处理指标包括失真指标,所述失真指标越大,表征所述目标信号处理算法对音频中的非噪声信号的损伤越大;
22、所述根据所述n个第一差值,确定所述目标信号处理算法的非噪声信号处理指标,包括:
23、根据所述n个第一差值确定所述失真指标。
24、结合本技术任一实施方式,所述目标音频还包括目标噪声信号;在所述将所述目标音频分为n段第一音频帧之后,所述方法还包括:
25、根据所述n段第一音频帧,确定所述n段第一音频帧中的所述目标噪声信号的增益,得到n个第一噪声增益,所述第一噪声增益与所述第一音频帧一一对应;
26、根据所述n个第一噪声增益,确定所述目标信号处理算法的降噪指标,所述降噪指标表征所述目标信号处理算法对音频中的噪声信号的去除效果。
27、结合本技术任一实施方式,所述原始音频还包括原始噪声信号,所述降噪指标包括噪声信号抑制指标,所述噪声信号抑制指标越大,表征所述目标信号处理算法对音频中的噪声信号的抑制越大;
28、所述根据所述n个第一噪声增益,确定所述目标信号处理算法的降噪指标,包括:
29、获取所述n段第二音频帧中的所述原始噪声信号的n个第二噪声增益,所述第二噪声增益与所述第二音频帧一一对应;
30、分别确定所述n个第一噪声增益与所述n个第二噪声增益中相对应的两个增益的差值,得到n个第二差值;
31、根据所述n个第二差值,确定所述噪声信号抑制指标。
32、结合本技术任一实施方式,所述降噪指标包括噪声信号残留指标,所述噪声信号残留指标越大,表征经所述目标信号处理算法对音频处理后,音频中残留的噪声信号越多;
33、所述根据所述n个第一噪声增益,确定所述目标信号处理算法的降噪指标,包括:
34、根据所述n个第一噪声增益确定所述噪声信号残留指标。
35、结合本技术任一实施方式,在得到所述n个第二差值之后,所述方法还包括:
36、确定所述n个第二差值中时间戳相邻的两个差值的差得到第三差值;
37、根据所述第三差值确定所述目标信号处理算法的稳定性指标,所述第三差值与所述稳定性指标呈负相关,所述稳定性指标越大表征所述目标信号处理算法的稳定性越好。
38、结合本技术任一实施方式,在得到n个第一差值之后,所述方法还包括:
39、确定所述n个第一差值中时间戳相邻的两个差值的差得到第四差值;
40、根据所述第四差值确定所述目标信号处理算法的稳定性指标,所述第四差值与所述稳定性指标呈负相关,所述稳定性指标越大表征所述目标信号处理算法的稳定性越好。
41、结合本技术任一实施方式,在所述根据所述第三差值确定所述目标信号处理算法的稳定性之后,所述方法还包括:
42、对所述非噪声信号处理指标、所述降噪指标和所述稳定性指标进行融合,得到所述目标信号处理算法的目标评价指标;
43、获取目标映射关系,所述目标映射关系表征评价指标与音频的评价分数的映射;
44、根据所述目标映射关系和所述目标评价指标,确定所述目标音频的目标评价分数,所述目标评价分数表征所述目标音频的音质。
45、结合本技术任一实施方式,所述n段第一音频帧包括第三音频帧,所述n个第三非噪声增益包括与所述第三音频帧对应的第五非噪声增益;
46、所述根据所述n段第一音频帧,得到所述n段第一音频帧中的非噪声信号的n个第三非噪声增益,包括:
47、对所述第三音频帧进行傅里叶变换,得到m个频点;
48、确定m个频点的非噪声信号的增益得到m个第六非噪声增益,所述第六非噪声增益均与所述频点一一对应;
49、根据所述m个第六非噪声增益,得到所述第五非噪声增益。
50、结合本技术任一实施方式,所述目标信号处理算法包括:音频的降噪算法、音频的编解码算法。
51、第二方面,提供了一种音频处理装置,所述装置包括:
52、获取单元,用于获取目标音频,所述目标音频为原始音频经过目标信号处理算法处理后得到的音频,所述目标音频包括第一非噪声信号,所述原始音频包括第二非噪声信号;
53、处理单元,用于根据所述目标音频,得到所述第一非噪声信号的第一非噪声增益;
54、所述获取单元,还用于获取所述第二非噪声信号的第二非噪声增益;
55、确定单元,用于基于所述第一非噪声增益和所述第二非噪声增益的差异,确定所述目标信号处理算法的非噪声信号处理指标,所述非噪声信号处理指标表征所述目标信号处理算法对音频中的非噪声信号的处理效果。
56、结合本技术任一实施方式,所述处理单元,用于:
57、将所述目标音频分为n段第一音频帧;
58、根据所述n段第一音频帧,得到所述n段第一音频帧中的非噪声信号的n个第三非噪声增益,作为所述第一非噪声增益,所述第三非噪声增益与所述第一音频帧一一对应。
59、结合本技术任一实施方式,所述获取单元,用于:
60、获取所述目标信号处理算法、所述第二非噪声信号和原始噪声信号;
61、对所述第二非噪声信号和所述原始噪声信号进行融合,得到所述原始音频;
62、使用所述目标信号处理算法对所述原始音频进行处理,得到所述目标音频。
63、结合本技术任一实施方式,所述处理单元,用于:
64、对所述目标音频与所述第二非噪声信号进行对齐,得到已对齐目标音频;
65、将所述已对齐目标音频分为n段音频帧,得到所述n段第一音频帧。
66、结合本技术任一实施方式,所述原始音频包括n段第二音频帧,所述第一音频帧与所述第二音频帧一一对应;所述第二非噪声增益包括n个第四非噪声增益,所述n个第四非噪声增益为所述n段第二音频帧中的非噪声信号的增益;
67、所述确定单元,用于:
68、分别确定所述n个第三非噪声增益与所述n个第四非噪声增益中相对应的两个增益的差值,得到n个第一差值;
69、根据所述n个第一差值,确定所述目标信号处理算法的非噪声信号处理指标。
70、结合本技术任一实施方式,所述非噪声信号处理指标包括失真指标,所述失真指标越大,表征所述目标信号处理算法对音频中的非噪声信号的损伤越大;
71、所述确定单元,用于:
72、根据所述n个第一差值确定所述失真指标。
73、结合本技术任一实施方式,所述目标音频还包括目标噪声信号;所述确定单元,还用于:
74、根据所述n段第一音频帧,确定所述n段第一音频帧中的所述目标噪声信号的增益,得到n个第一噪声增益,所述第一噪声增益与所述第一音频帧一一对应;
75、根据所述n个第一噪声增益,确定所述目标信号处理算法的降噪指标,所述降噪指标表征所述目标信号处理算法对音频中的噪声信号的去除效果。
76、结合本技术任一实施方式,所述原始音频还包括原始噪声信号,所述降噪指标包括噪声信号抑制指标,所述噪声信号抑制指标越大,表征所述目标信号处理算法对音频中的噪声信号的抑制越大;
77、所述确定单元,用于:
78、获取所述n段第二音频帧中的所述原始噪声信号的n个第二噪声增益,所述第二噪声增益与所述第二音频帧一一对应;
79、分别确定所述n个第一噪声增益与所述n个第二噪声增益中相对应的两个增益的差值,得到n个第二差值;
80、根据所述n个第二差值,确定所述噪声信号抑制指标。
81、结合本技术任一实施方式,所述降噪指标包括噪声信号残留指标,所述噪声信号残留指标越大,表征经所述目标信号处理算法对音频处理后,音频中残留的噪声信号越多;
82、所述确定单元,用于:
83、根据所述n个第一噪声增益确定所述噪声信号残留指标。
84、结合本技术任一实施方式,所述确定单元,还用于:
85、确定所述n个第二差值中时间戳相邻的两个差值的差得到第三差值;
86、根据所述第三差值确定所述目标信号处理算法的稳定性指标,所述第三差值与所述稳定性指标呈负相关,所述稳定性指标越大表征所述目标信号处理算法的稳定性越好。
87、结合本技术任一实施方式,所述确定单元,还用于:
88、确定所述n个第一差值中时间戳相邻的两个差值的差得到第四差值;
89、根据所述第四差值确定所述目标信号处理算法的稳定性指标,所述第四差值与所述稳定性指标呈负相关,所述稳定性指标越大表征所述目标信号处理算法的稳定性越好。
90、结合本技术任一实施方式,所述处理单元,还用于对所述非噪声信号处理指标、所述降噪指标和所述稳定性指标进行融合,得到所述目标信号处理算法的目标评价指标;
91、所述获取单元,还用于获取目标映射关系,所述目标映射关系表征评价指标与音频的评价分数的映射;
92、所述确定单元,还用于根据所述目标映射关系和所述目标评价指标,确定所述目标音频的目标评价分数,所述目标评价分数表征所述目标音频的音质。
93、结合本技术任一实施方式,所述n段第一音频帧包括第三音频帧,所述n个第三非噪声增益包括与所述第三音频帧对应的第五非噪声增益;
94、所述处理单元,用于:
95、对所述第三音频帧进行傅里叶变换,得到m个频点;
96、确定m个频点的非噪声信号的增益得到m个第六非噪声增益,所述第六非噪声增益均与所述频点一一对应;
97、根据所述m个第六非噪声增益,得到所述第五非噪声增益。
98、结合本技术任一实施方式,所述目标信号处理算法包括:音频的降噪算法、音频的编解码算法。
99、第三方面,提供了一种电子设备,其特征在于,包括:处理器和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任意一种可能实现的方式的方法。
100、第四方面,提供了另一种电子设备,包括:处理器、发送装置、输入装置、输出装置和存储器,所述存储器用于存储计算机程序代码,所述计算机程序代码包括计算机指令,在所述处理器执行所述计算机指令的情况下,所述电子设备执行如上述第一方面及其任一实施方式。
101、第五方面,提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,所述计算机程序包括程序指令,在所述程序指令被处理器执行的情况下,使所述处理器执行如上述第一方面及其任一实施方式。
102、第六方面,提供了一种计算机程序产品,所述计算机程序产品包括计算机程序或指令,在所述计算机程序或指令在计算机上运行的情况下,使得所述计算机执行上述第一方面及其任一实施方式。
103、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本技术。
104、因为目标音频为原始音频经过目标信号处理算法处理后的音频,目标音频包括第一非噪声信号,原始音频包括第二非噪声信号,所以第一非噪声信号是第二非噪声信号经过目标信号处理算法处理得到的。由于目标信号处理算法在对原始音频进行处理的过程中,可能会对原始音频中的第二非噪声信号进行处理,进而导致第二非噪声信号的增益发生变化,故第一非噪声增益与第二非噪声增益可能存在差异,而且该差异是由于目标信号处理算法的处理而产生的。因此,在本技术实施例中,音频处理装置在获取目标音频后,根据目标音频得到第一非噪声信号的第一非噪声增益,然后在获取第二非噪声信号的第二非噪声增益后,可基于第一非噪声增益和第二非噪声增益的差异,确定目标信号处理算法的非噪声信号处理指标。
105、而且由于基于第一非噪声增益和第二非噪声增益的差异,确定目标信号处理算法的非噪声信号处理指标,未涉及目标音频中的噪声信号和原始的噪声信号,通过该种方法确定目标信号处理算法的非噪声信号处理指标,可降低噪声信号的干扰,进而可提高非噪声信号处理指标的准确度,从而基于非噪声信号处理指标评估目标信号处理算法的处理效果,可提高评估结果的准确度。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22488.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
上一篇
语音信息处理方法及装置
下一篇
返回列表