音频解码、编码方法、装置、电子设备及存储介质与流程
- 国知局
- 2025-01-10 13:24:51
本申请涉及通信,尤其涉及一种音频解码、编码方法、装置、电子设备及存储介质。
背景技术:
1、由于语音通信的便利性和及时性,语音通话的应用越来越广泛,例如在网络会议的会议参与方之间传输音频信号(例如语音信号)。而在语音通话中,语音信号可能会被混有噪声等声学干扰,语音信号中所混有的噪声会导致通话质量变差,从而极大地影响了用户的听觉体验。
2、然而,对于如何对语音信号进行增强处理以抑制噪声部分,相关技术尚无有效的解决方案。
技术实现思路
1、本申请实施例提供一种音频解码、编码方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够有效抑制音频信号中的声学干扰,进而提高重建得到的音频信号的质量。
2、本申请实施例的技术方案是这样实现的:
3、本申请实施例提供一种音频解码方法,包括:
4、获取码流,其中,所述码流是对音频信号进行编码得到的;
5、对所述码流进行解码处理,得到所述音频信号的特征向量的预测值;
6、对所述特征向量的预测值进行标签提取处理,得到用于信号增强的标签信息向量,其中,所述标签信息向量的维度与所述特征向量的预测值的维度相同;
7、基于所述特征向量的预测值和所述标签信息向量进行信号重建;
8、将通过所述信号重建得到的所述音频信号的预测值,作为所述码流的解码结果。
9、本申请实施例提供一种音频解码装置,包括:
10、获取模块,用于获取码流,其中,所述码流是对音频信号进行编码得到的;
11、解码模块,用于对所述码流进行解码处理,得到所述音频信号的特征向量的预测值;
12、标签提取模块,用于对所述特征向量的预测值进行标签提取处理,得到用于信号增强的标签信息向量,其中,所述标签信息向量的维度与所述特征向量的预测值的维度相同;
13、重建模块,用于基于所述特征向量的预测值和所述标签信息向量进行信号重建;
14、确定模块,用于将通过所述信号重建得到的所述音频信号的预测值,作为所述码流的解码结果。
15、本申请实施例提供一种音频编码方法,包括:
16、获取音频信号;
17、对所述音频信号进行编码处理,得到码流,其中,所述码流用于供电子设备执行本申请实施例提供的音频解码方法。
18、本申请实施例提供一种音频编码装置,包括:
19、获取模块,用于获取音频信号;
20、编码模块,用于对所述音频信号进行编码处理,得到码流,其中,所述码流用于供电子设备执行本申请实施例提供的音频解码方法。
21、本申请实施例提供一种电子设备,包括:
22、存储器,用于存储可执行指令;
23、处理器,用于执行所述存储器中存储的可执行指令时,实现本申请实施例提供的音频编解码方法。
24、本申请实施例提供一种计算机可读存储介质,存储有可执行指令,用于被处理器执行时,实现本申请实施例提供的音频编解码方法。
25、本申请实施例提供一种计算机程序产品,包括计算机程序或指令,用于被处理器执行时,实现本申请实施例提供的音频编解码方法。
26、本申请实施例具有以下有益效果:
27、通过对解码得到的特征向量的预测值进行标签提取处理,得到用于信号增强的标签信息向量,并结合特征向量的预测值和标签信息向量进行信号重建,如此,相较于仅仅基于特征向量的预测值进行信号重建,结合特征向量的预测值和标签信息向量进行信号重建,相当于增加了音频信号中核心成分所占的比例,减小了噪声等声学干扰所占的比例,从而可以有效抑制编码端采集的音频信号中包括的噪声成分,进而提高了重建得到的音频信号的质量。
技术特征:1.一种音频解码方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,
3.根据权利要求1所述的方法,其特征在于,所述基于所述特征向量的预测值和所述标签信息向量进行信号重建,包括:
4.根据权利要求3所述的方法,其特征在于,所述对所述特征向量的预测值和所述标签信息向量进行融合处理,得到融合向量,包括:
5.根据权利要求3所述的方法,其特征在于,
6.根据权利要求1所述的方法,其特征在于,所述对所述码流进行解码处理,得到所述音频信号的特征向量的预测值,包括:
7.根据权利要求1所述的方法,其特征在于,
8.根据权利要求7所述的方法,其特征在于,
9.根据权利要求8所述的方法,其特征在于,
10.根据权利要求7至10任一项所述的方法,其特征在于,所述基于所述特征向量的预测值和所述标签信息向量进行信号重建,包括:
11.根据权利要求10所述的方法,其特征在于,所述对所述n个子带信号分别对应的特征向量的预测值、以及所述n个标签信息向量进行一一对应的融合处理,得到n个融合向量,包括:
12.根据权利要求10所述的方法,其特征在于,所述基于第j融合向量调用第j合成网络进行信号重建,得到第j子带信号的预测值,包括:
13.根据权利要求12所述的方法,其特征在于,
14.一种音频编码方法,其特征在于,所述方法包括:
15.一种处理码流的方法,其特征在于,所述码流基于权利要求1至13任一项所述的音频解码方法进行解码,或者根据权利要求14所述的音频编码方法产生。
16.一种处理码流的方法,其特征在于,在计算机可读存储介质上存储所述码流,所述码流基于权利要求1至13任一项所述的音频解码方法进行解码,或者根据权利要求14所述的音频编码方法产生。
17.一种音频解码装置,其特征在于,所述装置包括:
18.一种音频编码装置,其特征在于,所述装置包括:
19.一种计算机可读存储介质,存储有可执行指令,其特征在于,所述可执行指令被处理器执行时实现权利要求1至13任一项所述的音频解码方法或权利要求14所述的音频编码方法。
20.一种计算机程序产品,包括计算机程序或指令,其特征在于,所述计算机程序或指令被处理器执行时实现权利要求1至13任一项所述的音频解码方法或权利要求14所述的音频编码方法。
技术总结本申请提供了一种音频解码、编码方法、装置、电子设备及存储介质,可以应用于车载场景;音频解码方法包括:获取码流,其中,所述码流是对音频信号进行编码得到的;对所述码流进行解码处理,得到所述音频信号的特征向量的预测值;对所述特征向量的预测值进行标签提取处理,得到用于信号增强的标签信息向量,其中,所述标签信息向量的维度与所述特征向量的预测值的维度相同;基于所述特征向量的预测值和所述标签信息向量进行信号重建;将通过所述信号重建得到的所述音频信号的预测值,作为所述码流的解码结果。通过本申请,能够有效抑制音频信号中的声学干扰,进而提高重建得到的音频信号的质量。技术研发人员:史裕鹏,肖玮,王蒙,康迂勇,黄庆博受保护的技术使用者:腾讯科技(深圳)有限公司技术研发日:技术公布日:2025/1/6本文地址:https://www.jishuxx.com/zhuanli/20250110/352982.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。