技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频处理方法、装置、设备、存储介质及计算机程序产品与流程 > 正文

音频处理方法、装置、设备、存储介质及计算机程序产品与流程

国知局
2024-11-19 09:32:38

本申请涉及数据处理技术，尤其涉及一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

背景技术：

1、音频编解码技术是包括远程音视频通话在内的通信服务中的一项核心技术。语音编码技术，简单讲，就是使用较少的网络带宽资源去尽量多的传递语音信息。从香农信息论的角度来讲，语音编码是一种信源编码，信源编码的目的是在编码端尽可能的压缩我们想要传递信息的数据量，去掉信息中的冗余，同时在解码端还能够无损(或接近无损)的恢复出来。

2、然而，对于如何在保证音频质量的情况下，有效提高音频编码的效率，相关技术尚无有效的解决方案。

技术实现思路

1、本申请实施例提供一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够在保证音频质量的情况下，提高音频编码效率。

2、本申请实施例的技术方案是这样实现的：

3、本申请实施例提供一种音频处理方法，包括：

4、对音频信号进行多通道信号分解处理，得到所述音频信号的n个子带信号，其中，所述n为大于2的整数，所述n个子带信号的频段依次递增；

5、对每个所述子带信号进行信号压缩处理，得到每个所述子带信号的子带信号特征；

6、对每个所述子带信号的子带信号特征进行量化编码处理，得到每个所述子带信号的码流。

7、本申请实施例提供一种音频处理方法，包括：

8、对n个码流进行量化解码处理，得到每个所述码流对应的子带信号特征；

9、其中，所述n为大于2的整数，所述n个码流是对音频信号经过多通道信号分解处理后得到的n个子带信号分别进行编码得到的；

10、对每个所述子带信号特征进行信号解压处理，得到每个所述子带信号特征对应的估计子带信号；

11、对多个所述估计子带信号进行信号合成处理，得到所述多个码流对应的合成音频信号。

12、本申请实施例提供一种音频处理装置，包括：

13、分解模块，用于对音频信号进行多通道信号分解处理，得到所述音频信号的n个子带信号，其中，所述n为大于2的整数，所述n个子带信号的频段依次递增；

14、压缩模块，用于对每个所述子带信号进行信号压缩处理，得到每个所述子带信号的子带信号特征；

15、编码模块，用于对每个所述子带信号的子带信号特征进行量化编码处理，得到每个所述子带信号的码流。

16、本申请实施例提供一种音频处理装置，包括：

17、解码模块，用于对n个码流进行量化解码处理，得到每个所述码流对应的子带信号特征；

18、其中，所述n为大于2的整数，所述n个码流是对音频信号经过多通道信号分解处理后得到的n个子带信号分别进行编码得到的；

19、解压模块，用于对每个所述子带信号特征进行信号解压处理，得到每个所述子带信号特征对应的估计子带信号；

20、合成模块，用于对多个所述估计子带信号进行信号合成处理，得到所述多个码流对应的合成音频信号。

21、本申请实施例提供一种用于音频处理的电子设备，所述电子设备包括：

22、存储器，用于存储可执行指令；

23、处理器，用于执行所述存储器中存储的可执行指令时，实现本申请实施例提供的音频处理方法。

24、本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于引起处理器执行时，实现本申请实施例提供的音频处理方法。

25、本申请实施例提供一种计算机程序产品，包括计算机程序或指令，所述计算机程序或指令被处理器执行时实现本申请实施例提供的音频处理方法。

26、本申请实施例具有以下有益效果：

27、通过将音频信号分解为多个子带信号，对子带信号进行差异化的信号处理，并对减小了特征维度的子带信号特征进行量化编码，从而在保证音频质量的情况下，提高音频编码效率。

技术特征：

1.一种音频处理方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，所述对后n-k个子带信号分别进行频带扩展处理，得到所述后n-k个子带信号分别对应的子带信号特征，包括：

3.根据权利要求2所述的方法，其特征在于，所述基于所述子带信号包括的多个样本点进行频域变换处理，得到所述多个样本点分别对应的变换系数，包括：

4.根据权利要求1所述的方法，其特征在于，所述通过神经网络模型对前k个子带信号分别进行特征提取处理，得到所述前k个子带信号分别对应的子带信号特征，包括：

5.根据权利要求1所述的方法，其特征在于，每个所述子带信号的子带信号特征的特征维度与每个所述子带信号的频段非正相关，第n个子带信号的子带信号特征的特征维度小于第一个子带信号的子带信号特征的特征维度。

6.根据权利要求1所述的方法，其特征在于，所述获取音频信号的n个子带信号之前，所述方法还包括：

7.一种音频处理方法，其特征在于，所述方法包括：

8.根据权利要求7所述的方法，其特征在于，所述第一神经网络模型的结构复杂度与所述子带信号的子带信号特征的维度正相关。

9.根据权利要求7所述的方法，其特征在于，所述通过每个所述子带信号对应的第一神经网络模型，对每个所述子带信号进行特征提取处理，得到每个所述子带信号的子带信号特征，包括：

10.一种音频处理方法，其特征在于，所述方法包括：

11.根据权利要求10所述的方法，其特征在于，所述对后n-k个子带信号特征分别进行频带扩展的逆处理，得到所述后n-k个子带信号特征分别对应的估计子带信号，包括：

12.根据权利要求11所述的方法，其特征在于，所述基于所述子带信号特征对应的子带谱包络，对所述参考子带信号的参考变换系数进行增益处理，得到增益后的所述参考变换系数，包括：

13.根据权利要求10所述的方法，其特征在于，所述通过神经网络模型对前k个子带信号特征分别进行特征重建处理，得到所述前k个子带信号特征分别对应的估计子带信号，包括：

14.根据权利要求10所述的方法，其特征在于，所述基于多个所述估计子带信号，确定所述多个码流对应的合成音频信号，包括：

15.一种音频处理方法，其特征在于，所述方法包括：

16.根据权利要求15所述的方法，其特征在于，所述第二神经网络模型的结构复杂度与所述子带信号特征的维度正相关。

17.根据权利要求15所述的方法，其特征在于，所述通过每个所述子带信号特征对应的第二神经网络模型，对每个所述子带信号特征进行特征重建，得到每个所述子带信号特征对应的估计子带信号，包括：

18.一种音频处理装置，其特征在于，所述装置包括：

19.一种计算机可读存储介质，其特征在于，存储有可执行指令，用于被处理器执行时实现权利要求1至17任一项所述的音频处理方法。

20.一种计算机程序产品，包括计算机程序或指令，其特征在于，所述计算机程序或指令被处理器执行时实现权利要求1至17任一项所述的音频处理方法。

技术总结本申请提供了一种音频处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品；方法包括：对音频信号进行多通道信号分解处理，得到音频信号的N个子带信号，其中，N为大于2的整数，N个子带信号的频段依次递增；对每个子带信号进行信号压缩处理，得到每个子带信号的子带信号特征；对每个子带信号的子带信号特征进行量化编码处理，得到每个子带信号的码流。通过本申请，能够提高音频编码效率。技术研发人员：王蒙,肖玮,康迂勇,黄庆博,史裕鹏受保护的技术使用者：腾讯科技（深圳）有限公司技术研发日：技术公布日：2024/11/14