技术新讯 > 乐器声学设备的制造及制作,分析技术 > 用于音频编码模式选择的频谱分类器的制作方法 > 正文

用于音频编码模式选择的频谱分类器的制作方法

国知局
2024-06-21 11:30:07

本公开一般涉及通信，并且更具体地，涉及支持无线通信的通信方法以及相关设备和节点。

背景技术：

1、现代音频编解码器包括针对具有不同属性的信号而优化的多种压缩方案。通常，类似语音的信号使用在时域中操作的编解码器进行处理，而音乐信号使用在变换域中操作的编解码器进行处理。旨在处理语音信号和音乐信号两者的编码方案需要一种机制来识别输入信号(语音/音乐分类器)并在适当的编解码器模式之间切换。图1示出了使用基于输入信号的模式判定逻辑的多模式音频编解码器的概览图。

2、以类似的方式，在音乐信号类别(class)中，可以区分出更多类似噪声的音乐信号和泛音(harmonic)音乐信号，并针对这些组中的每个组构建分类器和最佳编码方案。特别是，具有稀疏和有峰(peaky)结构的信号的识别受到高度关注，因为变换域编解码器适合处理这些类型的信号。存在几种已知的旨在识别有峰信号结构(例如波峰c)的信号测量，它是根据以下c或频谱平坦度f确定的，其中，

3、

4、

5、高频谱平坦度或波峰可以指示可以选择适合于这样的频谱的编码模式。

技术实现思路

1、当前存在某些挑战。在音频编码领域中使用了多种语音-音乐分类器。然而，这些语音-音乐分类器可能无法区分音乐信号空间中的不同类别。许多语音-音乐分类器不能提供足够的分辨率来区分在复杂的多模式编解码器中所需的类别。

2、泛音和类噪声音乐片段区分的问题通过一种直接在频域系数上计算的新颖度量(metric)来解决。该度量是基于频谱的峰度(peakyness)测量和指示频谱的噪声分量的局部能量集中度的测量。

3、解决这些挑战的发明构思的各种实施例涉及在频谱临界频带中的频域中的分析。该分析至少包括峰度测量，以及各种实施例提供给出频谱中的噪声频带的指示的附加测量。基于这些测量，判定是否使用至少一种编码模式，该编码模式旨在用于具有强峰度的信号，同时避免具有噪声频带的信号。

4、根据发明构思的一些实施例，提供了一种在编码器中的确定要使用两个编码模式中的哪一个或两组编码模式中的哪一组的方法。所述方法包括导出输入音频信号的频谱。所述方法还包括获得所述频谱的临界频率范围的幅度。所述方法还包括获得峰度测量。所述方法还包括获得噪声频带检测测量。所述方法还包括至少基于所述峰度测量和所述噪声频带检测测量，确定要使用所述两个编码模式中的哪一个或所述两组编码模式中的哪一组。所述方法还包括基于被确定为要使用的编码模式，对所述输入音频信号进行编码。

5、提供了类似的编码器、计算机程序和计算机程序产品。

6、根据本发明构思的其他实施例，提供了一种在编码器中的确定输入音频信号是否具有高峰度和低能量集中度的方法。所述方法包括导出输入音频信号的频谱。所述方法还包括获得所述频谱的临界频率范围的幅度(magnitude)。所述方法还包括获得峰度测量。所述方法还包括获得噪声频带检测测量。所述方法还包括至少基于所述峰度测量和所述噪声频带检测测量，确定泛音条件。所述方法包括输出所述泛音条件是真还是假的指示。

7、提供了类似的编码器、计算机程序和计算机程序产品。

技术特征：

1.一种在编码器中的确定要使用两个编码模式中的哪一个或两组编码模式中的哪一组的方法，所述方法包括：

2.根据权利要求1所述的方法，其中，基于被确定为要使用的编码模式，对所述输入音频信号进行编码包括：

3.根据权利要求1或2所述的方法，其中，导出所述频谱包括：导出频谱x(m，k)，其中，x(m，k)表示帧m在频率索引k处的频谱。

4.根据权利要求1-3中任一项所述的方法，其中，导出所述频谱包括：

5.根据权利要求3或4所述的方法，其中，所述临界频率范围对应于kstart＝320且kend＝639，其中，输入采样率是32khz，帧长度是l＝640。

6.根据权利要求3-5中任一项所述的方法，其中，获得所述临界频率区域的所述频谱的幅度包括：根据以下公式获得所述临界频率区域的所述频谱的幅度：

7.根据权利要求6所述的方法，其中，获得所述峰度测量包括：根据以下公式获得所述峰度测量：

8.根据权利要求6所述的方法，其中，获得所述峰度测量包括：根据以下公式获得所述峰度测量：

9.根据权利要求8所述的方法，其中，athr＝0.1。

10.根据权利要求8所述的方法，其中，athr在范围[0.01，0.4]内。

11.根据权利要求1-10中任一项所述的方法，其中，获得所述噪声频带检测测量包括：根据以下公式获得所述噪声频带检测测量：

12.根据权利要求11所述的方法，其中，movmean(ai(m)，w)是根据以下公式确定的：

13.根据权利要求7-12中任一项所述的方法，还包括：根据以下公式对crest(m)和crestmod(m)进行低通滤波：

14.根据权利要求13所述的方法，其中，α在[0.5，1)的范围内，β在[0.5，1)的范围内。

15.根据权利要求1-14中任一项所述的方法，其中，至少基于所述峰度测量和所述噪声频带检测测量，确定要使用所述两个编码模式中的哪一个或所述两组编码模式中的哪一组包括：当harmonic_decision(m)为真时，确定所述两个编码模式中的一个或所述两组编码模式中的一组，其中，harmonic_decision(m)是根据以下公式确定的：

16.根据权利要求1-14中任一项所述的方法，其中，至少基于所述峰度测量和所述噪声频带检测测量，确定要使用所述两个编码模式中的哪一个或所述两组编码模式中的哪一组包括：当harmonic_decision(m)为真时，确定所述两个编码模式中的一个或所述两组编码模式中的一组，其中，harmonic_decision(m)是根据以下公式确定的：

17.根据权利要求1-14中任一项所述的方法，其中，至少基于所述峰度测量和所述噪声频带检测测量，确定所述编码模式包括：当harmonic_decision(m)为真时，使得能够确定所述编码模式，其中harmonic_decision(m)是根据以下公式确定的：

18.根据权利要求15-17中任一项所述的方法，其中，至少基于所述峰度测量和所述噪声频带检测测量，确定所述编码模式包括：至少基于所：述harmonic_decision(m)，确定所述编码模式。

19.根据权利要求18所述的方法，其中，基于所述harmonic_decision(m)，确定所述编码模式包括：

20.一种在编码器中的确定输入音频信号是否具有高峰度和低能量集中度的方法，所述方法包括：

21.根据权利要求20所述的方法，还包括：

22.根据权利要求21所述的方法，还包括：

23.根据权利要求22所述的方法，还包括：根据以下公式确定ai(m)：

24.根据权利要求23所述的方法，还包括：根据以下公式确定x(m，k)：

25.一种编码器装置(500)，包括：

26.一种编码器装置(500)，适于执行根据权利要求1-24中的至少一项的方法。

27.一种计算机程序，包括要由编码器装置(500)的处理电路(901)执行的程序代码，由此所述程序代码的执行使得所述编码器装置(500)执行根据权利要求1-24中任一项的操作。

28.一种计算机程序产品，包括非暂时性存储介质，所述非暂时性存储介质包括要由编码器装置(500)的处理电路(901)执行的程序代码，由此所述程序代码的执行使得所述编码器装置(500)执行根据权利要求1-24中任一项的操作。

技术总结提供了一种在编码器中的确定要使用两个编码模式中的哪一个或两组编码模式中的哪一组的方法。该方法包括导出(1001)输入音频信号的频谱。该方法包括获得(1003)频谱的临界频率区域的幅度。该方法包括获得(1005)帧的峰度测量。该方法包括获得(1007)噪声频带检测测量。该方法包括至少基于峰度测量和噪声频带检测测量，确定(1009)要使用两个编码模式中的哪一个或两组编码模式中的哪一组。该方法包括基于被确定为要使用的编码模式，对输入音频信号进行编码(1011)。技术研发人员：C·基努蒂亚,E·诺维尔受保护的技术使用者：瑞典爱立信有限公司技术研发日：技术公布日：2024/2/25