音量均衡方法、装置、计算机设备和存储介质与流程
- 国知局
- 2024-06-21 11:51:18
本技术涉及计算机,特别是涉及一种音量均衡方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
1、在音乐演唱场景下,存在有若干种不同来源的声音,为了避免在演唱环节中不同来源的声音混合在一起时可能存在的不自然和不贴合问题,影响音乐的品质,需要针对不同来源的声音对应的音轨进行多路的音量均衡。
2、传统技术可通过对各路音轨进行预处理和特征分析,利用分析结果进行音量均衡。
3、然而,在实现本发明过程中,发明人发现现有技术中至少存在如下问题,现有技术是对各路音轨进行一遍预处理特征提取,然后基于分析结果来做音量均衡。无法实时的提供音量均衡的能力,需要等到音频全部录制完成后才能实现。且传统技术直接从时域的角度去考虑音量而忽略了人耳对应听觉的感知不是简单的参考波形的幅度,无法考虑到人耳对不同频率的响度会产生不同的听觉感知,甚至还可能导致调整后的音乐中部分女声比男声更亮更明显的问题,不利于提高音量均衡结果的准确度。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种能够提高音量均衡结果的准确度的音量均衡方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
2、第一方面,本技术提供了一种音量均衡方法,包括:
3、分别将用于组成目标合唱音频的参考人声音频和待均衡人声音频转换为bark域,得到所述参考人声音频对应的第一bark域信号和所述待均衡人声音频对应的第二bark域信号;
4、根据所述第一bark域信号和所述第二bark域信号在各音频帧上的信号差异,确定针对所述各音频帧的响度调整参考信息;
5、根据所述各音频帧的响度调整参考信息,确定音量均衡参数;所述音量均衡参数用于对所述待均衡人声音频进行音量均衡。
6、在其中一个实施例中,所述根据所述第一bark域信号和所述第二bark域信号在各音频帧上的信号差异,确定针对所述各音频帧的响度调整参考信息,包括:
7、对于所述各音频帧中的任一目标音频帧,在所述第一bark域信号和所述第二bark域信号中确定针对所述目标音频帧的目标峰值点;
8、根据所述目标峰值点在所述第一bark域信号中对应的信号值与所述目标峰值点在所述第二bark域信号中对应的信号值之间的差值,确定各所述目标峰值点对应的信号差值;
9、从各所述目标峰值点对应的信号差值中,确定出针对所述目标音频帧的响度调整参考信息。
10、在其中一个实施例中,所述从各所述目标峰值点对应的信号差值中,确定出针对所述目标音频帧的响度调整参考信息,包括:
11、根据各所述目标峰值点对应的信号差值,确定各所述目标峰值点对应的信号差值中的中位数;
12、在所述中位数小于预设的信号差值阈值的情况下,将针对所述目标音频帧的响度调整参考信息设置为预设的响度调整参考值;
13、在所述中位数大于或等于所述预设的信号差值阈值的情况下,将所述中位数作为针对所述目标音频帧的响度调整参考信息。
14、在其中一个实施例中,所述根据所述各音频帧的响度调整参考信息,确定音量均衡参数,包括:
15、对所述各音频帧的响度调整参考信息进行平滑处理,得到所述各音频帧对应的响度调整参数;
16、获取预设的响度调整约束范围,根据所述各音频帧对应的响度调整参数与所述响度调整约束范围之间的关系,输出所述音量均衡参数。
17、在其中一个实施例中,所述对所述各音频帧的响度调整参考信息进行平滑处理,得到所述各音频帧对应的响度调整参数,包括:
18、获取所述第二bark域信号对应的信号采样率;
19、根据所述信号采样率和所述第二bark域信号对应的第一响应时间,确定针对所述第二bark域信号的第一平滑参数,以及,根据所述信号采样率和所述第二bark域信号对应的第二响应时间,确定针对所述第二bark域信号的第二平滑参数;
20、根据所述第一平滑参数和所述第二平滑参数,对所述响度调整参考信息进行平滑处理,得到所述各音频帧对应的响度调整参数。
21、在其中一个实施例中,所述响度调整约束范围包括响度调整约束上限和响度调整约束下限,所述根据所述各音频帧对应的响度调整参数与所述响度调整约束范围之间的关系,输出所述音量均衡参数,包括:
22、在所述各音频帧对应的响度调整参数大于所述响度调整约束上限的情况下,将所述各音频帧对应的音量均衡参数设置为所述响度调整约束上限;
23、在所述各音频帧对应的响度调整参数大于或等于所述响度调整约束下限,且所述各音频帧对应的响度调整参数小于或等于所述响度调整约束上限的情况下,将所述各音频帧对应的音量均衡参数设置为所述各音频帧对应的响度调整参数;
24、在所述各音频帧对应的响度调整参数小于所述响度调整约束下限的情况下,将所述各音频帧对应的音量均衡参数设置为所述响度调整约束下限。
25、在其中一个实施例中,所述分别将用于组成目标合唱音频的参考人声音频和待均衡人声音频转换为bark域,得到所述参考人声音频对应的第一bark域信号和所述待均衡人声音频对应的第二bark域信号,包括:
26、将所述参考人声音频转换为频域,得到所述参考人声音频对应的第一频域信号,通过预训练的bark域滤波器,将所述第一频域信号转换为所述第一bark域信号;
27、以及,将所述待均衡人声音频转换为频域,得到所述待均衡人声音频对应的第二频域信号,通过预训练的bark域滤波器,将所述第二频域信号转换为所述第二bark域信号。
28、在其中一个实施例中,所述方法还包括:
29、按照预设的人声音频选择策略,从组成所述目标合唱音频的至少两路人声音频中确定出所述参考人声音频;
30、将所述至少两路人声音频中除所述参考人声音频以外的人声音频确定为所述待均衡人声音频。
31、第二方面,本技术还提供了一种音量均衡装置,包括:
32、转换模块,用于分别将用于组成目标合唱音频的参考人声音频和待均衡人声音频转换为bark域,得到所述参考人声音频对应的第一bark域信号和所述待均衡人声音频对应的第二bark域信号;
33、确定模块,用于根据所述第一bark域信号和所述第二bark域信号在各音频帧上的信号差异,确定针对所述各音频帧的响度调整参考信息;
34、均衡模块,用于根据所述各音频帧的响度调整参考信息,确定音量均衡参数;所述音量均衡参数用于对所述待均衡人声音频进行音量均衡。
35、第三方面,本技术还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
36、第四方面,本技术还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
37、第五方面,本技术还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现上述的方法的步骤。
38、上述音量均衡方法、装置、计算机设备、存储介质和计算机程序产品,通过分别将用于组成目标合唱音频的参考人声音频和待均衡人声音频转换为bark域,得到参考人声音频对应的第一bark域信号和待均衡人声音频对应的第二bark域信号,从而将需要进行音量均衡的待均衡人声音频以及作为音量均衡参照的参考人声音频转换至符合人耳听觉的直观感受的bark域中,得到参考人声音频和待均衡人声音频各自对应的bark域信号;根据第一bark域信号和第二bark域信号在各音频帧上的信号差异,确定针对各音频帧的响度调整参考信息,从而通过分析参考人声音频和待均衡人声音频各自对应的bark域信号之间的信号差异,初步确定作为音量均衡参考的响度调整参考信息;根据各音频帧的响度调整参考信息,确定音量均衡参数,从而对响度调整参考信息进行进一步的数据处理,得到用于对待均衡人声音频进行音量均衡的音量均衡参数,能够通过分析参考人声音频对应的第一bark域信号和待均衡人声音频对应的第二bark域信号之间的信号差异,初步确定作为音量均衡参考的响度调整参考信息,并对响度调整参考信息进行平滑、范围约束等处理,得到音量均衡参数,从而利用音量均衡参数对待均衡人声音频进行音量均衡,实现实时分析合唱场景下参考人声音频和待均衡人声音频在bark域上的信号差异,结合平滑处理和取值约束,确定针对待均衡人声音频的音量均衡参数,从而利用音量均衡参数对待均衡人声音频进行音量均衡,进而提高音量均衡结果的准确度。
本文地址:https://www.jishuxx.com/zhuanli/20240618/24000.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。