技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频解码、编码方法、装置、电子设备及存储介质与流程 > 正文

音频解码、编码方法、装置、电子设备及存储介质与流程

国知局
2025-01-10 13:24:51

本申请涉及通信，尤其涉及一种音频解码、编码方法、装置、电子设备及存储介质。

背景技术：

1、由于语音通信的便利性和及时性，语音通话的应用越来越广泛，例如在网络会议的会议参与方之间传输音频信号(例如语音信号)。而在语音通话中，语音信号可能会被混有噪声等声学干扰，语音信号中所混有的噪声会导致通话质量变差，从而极大地影响了用户的听觉体验。

2、然而，对于如何对语音信号进行增强处理以抑制噪声部分，相关技术尚无有效的解决方案。

技术实现思路

1、本申请实施例提供一种音频解码、编码方法、装置、电子设备、计算机可读存储介质及计算机程序产品，能够有效抑制音频信号中的声学干扰，进而提高重建得到的音频信号的质量。

2、本申请实施例的技术方案是这样实现的：

3、本申请实施例提供一种音频解码方法，包括：

4、获取码流，其中，所述码流是对音频信号进行编码得到的；

5、对所述码流进行解码处理，得到所述音频信号的特征向量的预测值；

6、对所述特征向量的预测值进行标签提取处理，得到用于信号增强的标签信息向量，其中，所述标签信息向量的维度与所述特征向量的预测值的维度相同；

7、基于所述特征向量的预测值和所述标签信息向量进行信号重建；

8、将通过所述信号重建得到的所述音频信号的预测值，作为所述码流的解码结果。

9、本申请实施例提供一种音频解码装置，包括：

10、获取模块，用于获取码流，其中，所述码流是对音频信号进行编码得到的；

11、解码模块，用于对所述码流进行解码处理，得到所述音频信号的特征向量的预测值；

12、标签提取模块，用于对所述特征向量的预测值进行标签提取处理，得到用于信号增强的标签信息向量，其中，所述标签信息向量的维度与所述特征向量的预测值的维度相同；

13、重建模块，用于基于所述特征向量的预测值和所述标签信息向量进行信号重建；

14、确定模块，用于将通过所述信号重建得到的所述音频信号的预测值，作为所述码流的解码结果。

15、本申请实施例提供一种音频编码方法，包括：

16、获取音频信号；

17、对所述音频信号进行编码处理，得到码流，其中，所述码流用于供电子设备执行本申请实施例提供的音频解码方法。

18、本申请实施例提供一种音频编码装置，包括：

19、获取模块，用于获取音频信号；

20、编码模块，用于对所述音频信号进行编码处理，得到码流，其中，所述码流用于供电子设备执行本申请实施例提供的音频解码方法。

21、本申请实施例提供一种电子设备，包括：

22、存储器，用于存储可执行指令；

23、处理器，用于执行所述存储器中存储的可执行指令时，实现本申请实施例提供的音频编解码方法。

24、本申请实施例提供一种计算机可读存储介质，存储有可执行指令，用于被处理器执行时，实现本申请实施例提供的音频编解码方法。

25、本申请实施例提供一种计算机程序产品，包括计算机程序或指令，用于被处理器执行时，实现本申请实施例提供的音频编解码方法。

26、本申请实施例具有以下有益效果：

27、通过对解码得到的特征向量的预测值进行标签提取处理，得到用于信号增强的标签信息向量，并结合特征向量的预测值和标签信息向量进行信号重建，如此，相较于仅仅基于特征向量的预测值进行信号重建，结合特征向量的预测值和标签信息向量进行信号重建，相当于增加了音频信号中核心成分所占的比例，减小了噪声等声学干扰所占的比例，从而可以有效抑制编码端采集的音频信号中包括的噪声成分，进而提高了重建得到的音频信号的质量。

技术特征：

1.一种音频解码方法，其特征在于，所述方法包括：

2.根据权利要求1所述的方法，其特征在于，

3.根据权利要求1所述的方法，其特征在于，所述基于所述特征向量的预测值和所述标签信息向量进行信号重建，包括：

4.根据权利要求3所述的方法，其特征在于，所述对所述特征向量的预测值和所述标签信息向量进行融合处理，得到融合向量，包括：

5.根据权利要求3所述的方法，其特征在于，

6.根据权利要求1所述的方法，其特征在于，所述对所述码流进行解码处理，得到所述音频信号的特征向量的预测值，包括：

7.根据权利要求1所述的方法，其特征在于，

8.根据权利要求7所述的方法，其特征在于，

9.根据权利要求8所述的方法，其特征在于，

10.根据权利要求7至10任一项所述的方法，其特征在于，所述基于所述特征向量的预测值和所述标签信息向量进行信号重建，包括：

11.根据权利要求10所述的方法，其特征在于，所述对所述n个子带信号分别对应的特征向量的预测值、以及所述n个标签信息向量进行一一对应的融合处理，得到n个融合向量，包括：

12.根据权利要求10所述的方法，其特征在于，所述基于第j融合向量调用第j合成网络进行信号重建，得到第j子带信号的预测值，包括：

13.根据权利要求12所述的方法，其特征在于，

14.一种音频编码方法，其特征在于，所述方法包括：

15.一种处理码流的方法，其特征在于，所述码流基于权利要求1至13任一项所述的音频解码方法进行解码，或者根据权利要求14所述的音频编码方法产生。

16.一种处理码流的方法，其特征在于，在计算机可读存储介质上存储所述码流，所述码流基于权利要求1至13任一项所述的音频解码方法进行解码，或者根据权利要求14所述的音频编码方法产生。

17.一种音频解码装置，其特征在于，所述装置包括：

18.一种音频编码装置，其特征在于，所述装置包括：

19.一种计算机可读存储介质，存储有可执行指令，其特征在于，所述可执行指令被处理器执行时实现权利要求1至13任一项所述的音频解码方法或权利要求14所述的音频编码方法。

20.一种计算机程序产品，包括计算机程序或指令，其特征在于，所述计算机程序或指令被处理器执行时实现权利要求1至13任一项所述的音频解码方法或权利要求14所述的音频编码方法。

技术总结本申请提供了一种音频解码、编码方法、装置、电子设备及存储介质，可以应用于车载场景；音频解码方法包括：获取码流，其中，所述码流是对音频信号进行编码得到的；对所述码流进行解码处理，得到所述音频信号的特征向量的预测值；对所述特征向量的预测值进行标签提取处理，得到用于信号增强的标签信息向量，其中，所述标签信息向量的维度与所述特征向量的预测值的维度相同；基于所述特征向量的预测值和所述标签信息向量进行信号重建；将通过所述信号重建得到的所述音频信号的预测值，作为所述码流的解码结果。通过本申请，能够有效抑制音频信号中的声学干扰，进而提高重建得到的音频信号的质量。技术研发人员：史裕鹏,肖玮,王蒙,康迂勇,黄庆博受保护的技术使用者：腾讯科技（深圳）有限公司技术研发日：技术公布日：2025/1/6