技术新讯 > 乐器声学设备的制造及制作,分析技术 > 音频信号的处理方法及其装置与流程  >  正文

音频信号的处理方法及其装置与流程

  • 国知局
  • 2024-06-21 10:41:49

本技术涉及音频信号处理,特别涉及一种音频信号的处理方法及其装置。

背景技术:

1、随着生活质量的提高,人们对高质量音频的需求不断增大。为了利用有限的带宽更好地传输音频信号,通常需要先在编码端对音频信号进行数据压缩,然后将经过压缩的码流传输到解码端。解码端对接收到的码流进行解码处理,得到解码后的音频信号,解码后的音频信号用于回放。

2、然而,对音频信号进行压缩的过程中可能会对音频信号的音质造成影响。因此,如何在保证音频信号的音质效果的同时,提升对音频信号的压缩效率,成为一个亟需解决的技术问题。

技术实现思路

1、本技术提供了一种音频信号的处理方法及其装置,在保证音质效果的同时,提升对音频信号进行编码的压缩效率。所述技术方案如下:

2、第一方面,本技术提供了一种音频信号的处理方法。该方法包括:获取音频信号的多个子带及每个子带的标度因子;基于多个子带的标度因子,确定用于对音频信号的频谱包络进行整形的基准值;以基准值为基线,对音频信号的频谱包络进行整形,得到经过整形的频谱包络对应的每个子带的调节因子,调节因子用于对音频信号的频谱值进行量化,和/或,调节因子用于对频谱值的码值进行反量化。

3、在本技术提供的音频信号的处理方法中,在获取音频信号的多个子带及每个子带的标度因子后,可以基于多个子带的标度因子,确定对音频信号的频谱包络进行整形的基准值,并以基准值为基线,对音频信号的频谱包络进行整形,得到经过整形的频谱包络对应的每个子带的调节因子。由于调节因子用于对音频信号的频谱值进行量化,因此通过采用该方法在基准值的基础上对音频信号的频谱包络进行整形,使得基于整形得到的调节因子对音频信号的频谱值进行量化时,能够在保证音质效果的同时,提升对音频信号进行编码的压缩效率。

4、在一种实现方式中,对音频信号的频谱包络进行整形,得到经过整形的频谱包络对应的每个子带的调节因子,包括:获取子带的标度因子与基准值的差距;基于差距对子带的标度因子进行调整,得到调节因子。

5、能量比较高的子带对能量比较低的子带有声学掩蔽效应。即当相邻的子带的能量不同时,相邻的子带之间存在掩蔽效应,在对音频信号进行整形时,可以对多个子带的标度因子执行掩蔽处理,以便于获取较好的音质。则可选地,在以基准值为基线,对音频信号的频谱包络进行整形,得到经过整形的频谱包络对应的每个子带的调节因子之前,该方法还包括:对子带的标度因子进行掩蔽处理,使用子带经过掩蔽处理的标度因子更新子带的标度因子。则差距可以基于基准值和子带经过掩蔽处理的标度因子得到。

6、在一种实现方式中,当音频信号为双声道信号时,基于差距对子带的标度因子进行调整,得到调节因子,包括:对差距进行缩小处理,得到经过缩小处理的差距;基于经过缩小处理的差距和基准值,更新子带的标度因子;基于子带更新后的标度因子,得到调节因子。

7、其中,差距的缩小倍数基于差距的大小确定。当音频信号的强度大于基准值时,人耳对该音频信号更敏感,当音频信号的强度小于或等于基准值时,人耳对该音频信号的敏感度较弱,则当差距指示子带的标度因子大于基准值时,其缩小倍数可以小于差距指示子带的标度因子小于或等于基准值时的缩小倍数。

8、在另一种实现方式中,当音频信号为单声道信号时,可以以放大较大的标度因子,去掉较小的标度因子为原则,对子带的标度因子进行调整,则基于差距对子带的标度因子进行调整,得到调节因子,包括:将差距确定为调节因子。

9、可选地,在获取子带的标度因子与基准值的差距之前,该方法还包括:对子带的标度因子进行信号增强处理,使用子带经过信号增强处理的标度因子更新子带的标度因子。此时,差距基于基准值和子带经过信号增强处理的标度因子得到。

10、在一种实现方式中,当音频信号为双声道信号时,基准值基于多个子带的标度因子的均值得到;当音频信号为单声道信号时,基准值基于多个子带的标度因子中的最大值得到。

11、可选地,在基于多个子带的标度因子,确定用于对音频信号的频谱包络进行整形的基准值之前,该方法还包括:对子带的标度因子进行掩蔽处理,使用子带经过掩蔽处理的标度因子更新子带的标度因子。则基准值基于多个子带经过掩蔽处理的标度因子得到。

12、在一种实现方式中,当音频信号为单声道信号时,在基于多个子带的标度因子,确定用于对音频信号的频谱包络进行整形的基准值之前,该方法还包括:对子带的标度因子进行信号增强处理,使用子带经过信号增强处理的标度因子更新子带的标度因子。

13、可选地,对子带的标度因子进行信号增强处理的强度基于子带的频率和多个子带的总个数确定。在一种实现方式中,该强度可以基于该子带的频率在音频信号的频率中的占比大小确定。可选地,可以基于该子带的频率在音频信号的频率中的占比大小,对该子带的标度因子进行叠加,得到该子带经过信号增强处理的标度因子。

14、在一种实现方式中,对子带的标度因子进行掩蔽处理,包括:获取子带的相邻子带对子带的掩蔽系数及相邻子带的标度因子,掩蔽系数用于指示掩蔽程度;基于子带的标度因子、相邻子带的标度因子、及相邻子带对子带的掩蔽系数,获取子带经过掩蔽处理的标度因子。

15、可选地,当音频信号为双声道信号时,掩蔽系数基于子带的标度因子与基准值的大小关系确定;当音频信号为单声道信号时,掩蔽系数基于子带与相邻子带的频率关系确定。

16、本技术实施例提供的音频信号的处理方法可以在满足指定条件时执行,即以基准值为基线,对音频信号的频谱包络进行整形,得到经过整形的频谱包络对应的每个子带的调节因子,包括:当音频信号的码率小于码率阈值,和/或,音频信号的能量集中度小于集中度阈值时,以基准值为基线,对音频信号的频谱包络进行整形,得到经过整形的频谱包络对应的每个子带的调节因子。

17、码率是数据传输时单位时间传送的数据位数。传输音频信号的场景可以包括低码率的场景和高码率的场景。低码率的场景通常发生在干扰较大的情况下,例如,在地铁、机场和火车站等信号较易受到干扰的环境中。高码率的场景通常发生在干扰较小的情况下,例如安静的室内等对信号干扰较小的环境中。而频域噪声整形是利用人耳听觉掩蔽原理对编解码器所产生的量化噪声谱进行整形。因此,可以根据码率确定是否对音频信号进行整形。

18、能量集中度用于表示音频内容在音频信号中的分布情况。根据音频信号的能量集中度能够区分音频信号是否包含实质内容,当音频信号包含实质内容时,可以对音频信号进行整形,以提高传输至音频接收设备的音频信号的音质。当音频信号不包括实质内容时,则无需对音频信号进行整形。

19、第二方面,本技术提供了一种音频信号的处理装置,该装置包括:获取模块,用于获取音频信号的多个子带及每个子带的标度因子;确定模块,用于基于多个子带的标度因子,确定用于对音频信号的频谱包络进行整形的基准值;处理模块,用于以基准值为基线,对音频信号的频谱包络进行整形,得到经过整形的频谱包络对应的每个子带的调节因子,调节因子用于对音频信号的频谱值进行量化,和/或,调节因子用于对频谱值的码值进行反量化。

20、可选地,处理模块具体用于:获取子带的标度因子与基准值的差距;基于差距对子带的标度因子进行调整,得到调节因子。

21、可选地,处理模块还用于:对子带的标度因子进行掩蔽处理,使用子带经过掩蔽处理的标度因子更新子带的标度因子。

22、可选地,当音频信号为双声道信号时,处理模块具体用于:对差距进行缩小处理,得到经过缩小处理的差距;基于经过缩小处理的差距和基准值,更新子带的标度因子;基于子带更新后的标度因子,得到调节因子。

23、可选地,差距的缩小倍数基于差距的大小确定。

24、可选地,当音频信号为单声道信号时,处理模块具体用于:将差距确定为调节因子。

25、可选地,处理模块还用于:对子带的标度因子进行信号增强处理,使用子带经过信号增强处理的标度因子更新子带的标度因子。

26、可选地,当音频信号为双声道信号时,基准值基于多个子带的标度因子的均值得到;当音频信号为单声道信号时,基准值基于多个子带的标度因子中的最大值得到。

27、可选地,处理模块还用于:对子带的标度因子进行掩蔽处理,使用子带经过掩蔽处理的标度因子更新子带的标度因子。

28、可选地,当音频信号为单声道信号时,处理模块还用于:对子带的标度因子进行信号增强处理,使用子带经过信号增强处理的标度因子更新子带的标度因子。

29、可选地,对子带的标度因子进行信号增强处理的强度基于子带的频率和多个子带的总个数确定。

30、可选地,处理模块具体用于:获取子带的相邻子带对子带的掩蔽系数及相邻子带的标度因子,掩蔽系数用于指示掩蔽程度;基于子带的标度因子、相邻子带的标度因子、及相邻子带对子带的掩蔽系数,获取子带经过掩蔽处理的标度因子。

31、可选地,当音频信号为双声道信号时,掩蔽系数基于子带的标度因子与基准值的大小关系确定;当音频信号为单声道信号时,掩蔽系数基于子带与相邻子带的频率关系确定。

32、可选地,处理模块具体用于:当音频信号的码率小于码率阈值,和/或,音频信号的能量集中度小于集中度阈值时,以基准值为基线,对音频信号的频谱包络进行整形,得到经过整形的频谱包络对应的每个子带的调节因子。

33、第三方面,本技术提供了一种计算机设备,包括存储器和处理器,存储器存储有程序指令,处理器运行程序指令以执行本技术第一方面以及其任一种可能的实现方式中提供的方法。

34、第四方面,本技术提供了一种计算机可读存储介质,该计算机可读存储介质为非易失性计算机可读存储介质,该计算机可读存储介质包括程序指令,当程序指令在计算机设备上运行时,使得计算机设备执行本技术第一方面以及其任一种可能的实现方式中提供的方法。

35、第五方面,本技术提供了一种包含指令的计算机程序产品,当计算机程序产品在计算机上运行时,使得计算机执行本技术第一方面以及其任一种可能的实现方式中提供的方法。

本文地址:https://www.jishuxx.com/zhuanli/20240618/21277.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。