一种音频处理方法、装置、设备及可读存储介质与流程
- 国知局
- 2024-06-21 11:37:39
本申请涉及音频处理,尤其涉及一种音频处理方法、装置、设备及可读存储介质。
背景技术:
1、在多种场景下均涉及音频文件下发,音频文件下发后用户可以播放该音频文件。由于在音频获取的过程中,例如每个音频文件的上传用户可以根据需求设置背景音、以及设置背景音的音量,或者在音频录制或者采集的过程中可能存在噪音,或者由于音频录制设备的性能问题,可能导致获取的音频文件的音频效果不理想。若直接对这些音频文件进行下发,同一用户在依次播放多个不同的音频文件时,可能会存在一些音频文件声音较大,用户播放该音频文件时会感到刺耳,一些音频文件声音较小,用户难以听清,降低用户体验。目前的方法一般是直接下发该音频文件,因此该种方式下发的音频文件的效果不理想,容易造成用户对相关音频的投诉,用户体验较差。
技术实现思路
1、本申请实施例提供一种音频处理方法、装置、设备及可读存储介质,可以提升音频文件的质量,减少音频刺耳的情况,减少用户投诉,进而提升用户体验。
2、第一方面,本申请提供一种音频处理方法,包括:
3、获取初始音频文件,分别采用算法集合中的n种响度处理算法对该初始音频文件进行音频处理,得到n个待选音频文件;一种响度处理算法对应一个待选音频文件,n为正整数;
4、分别获取该n个待选音频文件的音频特征参数;该音频特征参数用于指示待选音频文件的音频质量;
5、基于该n个待选音频文件的音频特征参数从该n个待选音频文件或该初始音频文件中确定目标音频文件,向终端设备下发该目标音频文件。
6、第二方面,本申请提供了一种音频处理装置,其特征在于,该装置包括:
7、音频处理单元,用于获取初始音频文件,分别采用算法集合中的n种响度处理算法对该初始音频文件进行音频处理,得到n个待选音频文件;一种响度处理算法对应一个待选音频文件,n为正整数;
8、参数获取单元,用于分别获取该n个待选音频文件的音频特征参数;该音频特征参数用于指示待选音频文件的音频质量;
9、文件确定单元,用于基于该n个待选音频文件的音频特征参数从该n个待选音频文件或该初始音频文件中确定目标音频文件,向终端设备下发该目标音频文件。
10、第三方面,本申请提供了一种计算机设备,包括:处理器、存储器、网络接口;
11、上述处理器与存储器、网络接口相连,其中,网络接口用于提供数据通信功能,上述存储器用于存储计算机程序代码,上述处理器用于调用上述计算机程序代码,以使包含该处理器的计算机设备执行上述音频处理方法。
12、第四方面,本申请提供了一种计算机可读存储介质,该计算机可读存储介质中存储有计算机程序,该计算机程序适于由处理器加载并执行,以使得具有该处理器的计算机设备执行上述音频处理方法。
13、第五方面,本申请提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行本申请第一方面中的各种可选方式中提供的音频处理方法。
14、本申请实施例中,通过采用多种响度处理算法对初始音频文件进行音频处理,得到多个待选音频文件;进而可以基于多个待选音频文件的音频特征参数从多个待选音频文件或初始音频文件中确定目标音频文件,向终端设备下发目标音频文件。通过响度处理算法可以将音频文件的响度调整到合适范围,由于对多种响度处理算法对应的待选音频文件进行效果评估,可以确定每种待选音频文件的效果,从而可以从中选择效果较好的音频文件进行下发,相当于在初始音频文件的基础上提升了音频文件的质量,可以减少音频刺耳的情况,进而减少对人耳的损伤,减少用户投诉,进而提升用户体验。
技术特征:1.一种音频处理方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述初始音频文件包括m帧音频数据;
3.根据权利要求1或2所述的方法,其特征在于,所述基于所述n个待选音频文件的音频特征参数从所述n个待选音频文件或所述初始音频文件中确定目标音频文件,包括:
4.根据权利要求3所述的方法,其特征在于,针对所述n个待选音频文件中的任一待选音频文件,所述任一待选音频文件的音频特征参数包括所述任一待选音频文件的最大增益值、增益值变化率、增益峰值数、增益方差、增益峰值、响度值、动态范围;
5.根据权利要求3所述的方法,其特征在于,针对所述n个待选音频文件中的任一待选音频文件,所述任一待选音频文件的音频特征参数包括所述任一待选音频文件的最大增益值、增益值变化率、增益峰值数、增益方差、增益峰值、响度值、动态范围;
6.根据权利要求3所述的方法,其特征在于,针对所述n个待选音频文件中的任一待选音频文件,所述任一待选音频文件的音频特征参数包括所述任一待选音频文件的最大增益值、增益值变化率、增益峰值数、增益方差、增益峰值、响度值;
7.根据权利要求3所述的方法,其特征在于,针对所述n个待选音频文件中的任一待选音频文件,所述任一待选音频文件的音频特征参数包括所述任一待选音频文件的最大增益值、增益值变化率、增益峰值数、增益方差、增益峰值;
8.根据权利要求4-7任一项所述的方法,其特征在于,所述n个待选音频文件中包括多个等级的待选音频文件;
9.根据权利要求3所述的方法,其特征在于,针对所述n个待选音频文件中的任一待选音频文件,所述任一待选音频文件的音频特征参数包括所述任一待选音频文件的最大增益值、增益值变化率、增益峰值数、增益方差;
10.一种音频处理装置,其特征在于,所述装置包括:
11.一种计算机设备,其特征在于,包括:处理器、存储器以及网络接口;
12.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序适于由处理器加载并执行,以使得具有所述处理器的计算机设备执行权利要求1-9任一项所述的方法。
技术总结本申请实施例公开了一种音频处理方法、装置、设备及可读存储介质,其中,方法包括:获取初始音频文件,分别采用算法集合中的N种响度处理算法对该初始音频文件进行音频处理,得到N个待选音频文件;一种响度处理算法对应一个待选音频文件,N为正整数;分别获取该N个待选音频文件的音频特征参数;该音频特征参数用于指示待选音频文件的音频质量;基于该N个待选音频文件的音频特征参数从该N个待选音频文件或该初始音频文件中确定目标音频文件,向终端设备下发该目标音频文件。采用本申请实施例,可以提升音频文件的质量,减少音频刺耳的情况,减少用户投诉,进而提升用户体验。技术研发人员:武倩平受保护的技术使用者:书行科技(北京)有限公司技术研发日:技术公布日:2024/3/21本文地址:https://www.jishuxx.com/zhuanli/20240618/22525.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表