技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频编码方法、音频解码方法、装置、可读存储介质与流程  >  正文

音频编码方法、音频解码方法、装置、可读存储介质与流程

  • 国知局
  • 2024-06-21 10:41:55

本申请涉及人工智能技术,尤其涉及一种音频编码方法、音频解码方法、装置、电子设备、计算机可读存储介质及计算机程序产品。

背景技术:

1、人工智能(ai,artificial intelligence)是计算机科学的一个综合技术,通过研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,例如自然语言处理技术以及机器学习/深度学习等几大方向,随着技术的发展,人工智能技术将在更多的领域得到应用,并发挥越来越重要的价值。

2、音频编解码技术是人工智能领域的重要应用之一,音频编解码技术是包括远程音视频通话在内的通信服务中的一项核心技术。语音编码技术,简单讲,就是使用较少的网络带宽资源去尽量多的传递语音信息。从香农信息论的角度来讲,语音编码是一种信源编码,信源编码的目的是在编码端尽可能的压缩我们想要传递信息的数据量,去掉信息中的冗余,同时在解码端还能够无损(或接近无损)的恢复出来。

3、相关技术中,解码端解码所生成的音频的质量较为单一,无法满足用户需求。

技术实现思路

1、本申请实施例提供一种音频编码方法、音频解码方法、装置、电子设备、计算机可读存储介质及计算机程序产品,能够在保证音频解码的效率的情况下,输出不同质量级别的合成音频信号。

2、本申请实施例的技术方案是这样实现的:

3、本申请实施例提供一种音频编码方法,包括:

4、响应于针对音频信号的编码请求,从多个编码模式中获取针对所述音频信号的目标编码模式,从多个码率模式中获取针对所述音频信号的目标码率模式;

5、通过所述目标编码模式,从所述音频信号中提取出所述音频信号的编码特征;

6、通过所述目标码率模式,对所述音频信号的编码特征进行信号编码处理,得到所述音频信号的音频码流;

7、基于所述目标编码模式以及所述目标码率模式,确定帧头;

8、基于所述音频码流以及所述帧头,生成所述音频信号的音频码流封装。

9、本申请实施例提供一种音频解码方法,包括:

10、响应于针对音频码流封装的解码请求,从所述音频码流封装包括的帧头中获取目标编码模式以及目标码率模式;

11、其中,所述音频码流封装包括的音频码流是通过所述目标编码模式以及所述目标码率模式,对音频信号进行音频编码得到的,所述目标编码模式是从多个编码模式中获取的,所述目标码率模式是从多个码率模式中获取的;

12、通过所述目标编码模式以及所述目标码率模式,对所述音频码流进行信号解码处理,得到所述音频码流对应的编码特征估计值;

13、通过所述目标编码模式,对所述音频码流对应的编码特征估计值进行重建处理,得到所述音频码流对应的合成音频信号。

14、本申请实施例提供一种音频编码装置,包括:

15、第二获取模块,用于响应于针对音频信号的编码请求,从多个编码模式中获取针对所述音频信号的目标编码模式,从多个码率模式中获取针对所述音频信号的目标码率模式;

16、提取模块,用于通过所述目标编码模式,从所述音频信号中提取出所述音频信号的编码特征;

17、信号编码模块,用于通过所述目标码率模式,对所述音频信号的编码特征进行信号编码处理,得到所述音频信号的音频码流;

18、构建模块,用于基于所述目标编码模式以及所述目标码率模式,确定帧头;

19、生成模块,用于基于所述音频码流以及所述帧头,生成所述音频信号的音频码流封装。

20、本申请实施例提供一种音频解码装置,包括:

21、第一获取模块,用于响应于针对音频码流封装的解码请求,从所述音频码流封装包括的帧头中获取目标编码模式以及目标码率模式;

22、其中,所述音频码流封装包括的音频码流是通过所述目标编码模式以及所述目标码率模式,对音频信号进行音频编码得到的,所述目标编码模式是从多个编码模式中获取的,所述目标码率模式是从多个码率模式中获取的;

23、信号解码模块,用于通过所述目标编码模式以及所述目标码率模式,对所述音频码流进行信号解码处理,得到所述音频码流对应的编码特征估计值;

24、重建模块,用于通过所述目标编码模式,对所述音频码流对应的编码特征估计值进行重建处理,得到所述音频码流对应的合成音频信号。

25、本申请实施例提供一种电子设备,所述电子设备包括:

26、存储器,用于存储计算机可执行指令;

27、处理器,用于执行所述存储器中存储的计算机可执行指令时,实现本申请实施例提供的音频编码方法或音频解码方法。

28、本申请实施例提供一种计算机可读存储介质,存储有计算机可执行指令,被处理器执行时,实现本申请实施例提供的音频编码方法或音频解码方法。

29、本申请实施例提供一种计算机程序产品,包括计算机可执行指令,所述计算机可执行指令被处理器执行时实现本申请实施例提供的音频编码方法或音频解码方法。

30、本申请实施例具有以下有益效果:

31、通过不同编码模式以及码率模式,对音频码流进行信号解码,从而得到不同精度的编码特征估计值,然后对不同精度的编码特征估计值进行重建,从而得到不同质量级别的合成音频信号,提高合成音频信号的质量的多样化,以满足用户的实际应用需求。

技术特征:

1.一种音频解码方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,

3.根据权利要求1或2所述的方法,其特征在于,所述目标编码模式为宽带编码模式时,所述通过所述目标编码模式,对所述音频码流对应的编码特征估计值进行重建处理,得到所述音频码流对应的合成音频信号,包括:

4.根据权利要求3所述的方法,其特征在于,所述对所述音频码流对应的编码特征估计值进行重建处理,得到所述音频码流对应的合成音频信号,包括:

5.根据权利要求4所述的方法,其特征在于,所述第三神经网络包括4个解码块,每个所述解码块包括4个或5个所述残差单元。

6.根据权利要求1所述的方法,其特征在于,

7.根据权利要求6所述的方法,其特征在于,

8.根据权利要求1所述的方法,其特征在于,所述通过所述目标编码模式,对所述音频码流对应的编码特征进行重建处理,得到所述音频码流对应的合成音频信号,包括:

9.根据权利要求8所述的方法,其特征在于,所述对所述编码特征包括的高频特征估计值进行高频重建处理,得到所述音频码流对应的高频子带信号估计值,包括:

10.根据权利要求9所述的方法,其特征在于,所述基于所述第一变换系数,对所述高频特征估计值进行频带扩展的逆处理,得到第一高频子带信号估计值,包括:

11.根据权利要求10所述的方法,其特征在于,

12.根据权利要求1所述的方法,其特征在于,所述帧头还包括至少1位声道位,所述声道位用于指示采用单声道解码方法或立体声解码方法对所述音频码流进行音频解码。

13.一种音频编码方法,其特征在于,所述方法包括:

14.根据权利要求13所述的方法,其特征在于,当所述目标编码模式为宽带编码模式时,所述通过所述目标编码模式,从所述音频信号中提取出所述音频信号的编码特征,包括:

15.根据权利要求14所述的方法,其特征在于,所述从所述音频信号中提取出所述音频信号的编码特征,包括:

16.根据权利要求15所述的方法,其特征在于,所述第一神经网络包括4个编码块,每个所述编码块包括4个或5个所述残差单元。

17.根据权利要求13或14所述的方法,其特征在于,

18.根据权利要求13所述的方法,其特征在于,当所述目标编码模式为超宽带编码模式时,所述通过所述目标编码模式,从所述音频信号中提取出所述音频信号的编码特征,包括:

19.根据权利要求18所述的方法,其特征在于,所述对所述高频子带信号进行高频分析处理,得到所述高频子带信号的高频特征,包括:

20.根据权利要求19所述的方法,其特征在于,所述对每个所述子帧进行频带扩展处理,得到每个所述子帧的子带谱包络,包括:

21.根据权利要求18所述的方法,其特征在于,

22.根据权利要求21所述的方法,其特征在于,

23.根据权利要求22所述的方法,其特征在于,所述残差值的数量为n时,n为大于1的正整数,所述基于所述第一个残差值,确定所述高频特征的残差特征,包括:

24.根据权利要求21-23任一项所述的方法,其特征在于,

25.根据权利要求24所述的方法,其特征在于,所述确定所述高频子带信号的平坦度边信息,包括:

26.根据权利要求13所述的方法,其特征在于,所述帧头还包括至少1位声道位,所述声道位用于指示采用单声道编码方法或立体声编码方法对所述音频信号进行音频编码。

27.一种音频解码装置,其特征在于,所述装置包括:

28.一种电子设备,其特征在于,所述电子设备包括:

29.一种计算机可读存储介质,其特征在于,存储有计算机可执行指令,被处理器执行时实现权利要求1至12任一项所述的音频编码方法,或权利要求13-26任一项所述的音频解码方法。

技术总结本申请提供了一种音频编码方法、音频解码方法、装置、电子设备、计算机可读存储介质及计算机程序产品;音频解码方法包括:响应于针对音频码流封装的解码请求,从音频码流封装包括的帧头中获取目标编码模式以及目标码率模式;其中,音频码流封装包括的音频码流是通过目标编码模式以及目标码率模式,对音频信号进行音频编码得到的,目标编码模式是从多个编码模式中获取的,目标码率模式是从多个码率模式中获取的;通过目标编码模式以及目标码率模式,对音频码流进行信号解码处理,得到音频码流对应的编码特征估计值;通过目标编码模式,对音频码流对应的编码特征估计值进行重建处理,得到音频码流对应的合成音频信号。技术研发人员:肖玮受保护的技术使用者:腾讯科技(深圳)有限公司技术研发日:技术公布日:2024/2/1

本文地址:https://www.jishuxx.com/zhuanli/20240618/21292.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。