技术新讯 > 乐器声学设备的制造及制作,分析技术 > 优化音频编解码的方法、系统、介质及设备与流程 > 正文

优化音频编解码的方法、系统、介质及设备与流程

国知局
2024-06-21 10:41:08

本申请涉及音频编解码，特别涉及一种优化音频编解码的方法、系统、介质及设备。

背景技术：

1、目前主流的蓝牙音频编码器如下：sbc：a2dp协议强制要求，使用最为广泛，是所有的蓝牙音频设备必须支持的，但音质一般；aac-lc:音质较好且应用较为广泛，很多主流的手机都支持，但与sbc相比，内存占用较大，且运算复杂度高，很多蓝牙设备都基于嵌入式平台，电池容量有限，处理器运算能力较差且内存有限，而且，其专利费较高；aptx系列：音质较好，但码率很高，aptx需要码率384kbps，而aptx-hd的码率为576kbps，且为高通独有的技术，较为封闭；ldac:音质较好，但码率也很高，分别是330kbps，660kbps和990kbps，由于蓝牙设备所处的无线环境特别复杂，稳定支持如此高的码率有一定的困难，且为索尼独有的技术，也很封闭；lhdc：音质较好，但码率也很高，典型的包括400kbps，600kbp和900kbps，如此高的码率，对于蓝牙的基带/射频设计提出了很高的要求。

2、基于上述原因，蓝牙国际联盟bluetooth sig联合众多厂商推出了lc3，主要面向低功耗蓝牙，也可以用于经典蓝牙，其具有较低延迟、较高的音质和编码增益以及在蓝牙领域无专利费的优点，受到广大厂商的关注。

3、在lc3音频编码器中，为了避免冲击信号引起的前回声(pre-echo)导致的音质降低，引入了时域噪声整形模块，其在编码端提取相关的lpc参数、执行滤波、对残差编码并将相关参数传输到解码端执行lpc逆滤波，以此消除前回声。其中，tns模块(时域噪声整形，temporal noise shaping)的引入虽然有效的降低了前回声的影响，但也存在明显不足，包括：需要占用系统带宽资源，每一帧最大需要传输16个lpc滤波器反射系数，这些从发射端(编码器)传输到接收端(解码器)的系数占用了有限的带宽资源；需要消耗较多的运算资源。

技术实现思路

1、针对现有技术中，常规音频编码器对音频进行时域噪声整形过程会占用较多的带宽资源和运算资源的问题，本申请提出一种优化音频编解码的方法、系统、介质及设备。

2、第一方面，本申请提出一种优化音频编解码的方法，包括：在音频编码过程中，确定音频信号对应的冲击信号，其中对音频信号进行分帧，并对得到的音频帧进行下采样；对进行下采样后的音频帧进行高通滤波；对高通滤波后的音频帧进行分块；计算各个分块对应的能量值；计算音频帧对应的能量包络；对音频帧进行冲击检测，若存在冲击信号则确定冲击位置；在音频解码过程中，根据冲击位置对音频帧对应的音频码流进行前回声抑制。

3、可选的，在音频编码过程中，确定音频信号对应的冲击信号，还包括：预先拓宽对音频信号进行冲击检测的采样率条件、帧长条件和编码码率条件，使得对具有不同采样率的音频信号进行冲击检测。

4、可选的，对音频帧进行分块，包括：根据预设分块个数对高通滤波后的音频帧进行分块，其中各个分块中具有预设数量的采样点。

5、可选的，在音频编码过程中，确定音频信号中对应的冲击信号，还包括：根据确定的冲击信号所在的冲击位置，确定冲击标志；根据冲击标志对冲击位置进行修正。

6、可选的，在音频解码过程中，根据冲击位置对音频帧对应的音频码流进行前回声抑制，包括：在音频解码端对音频码流进行解析，得到冲击位置；若冲击位置满足判断条件，则对音频码流进行前回声抑制，并输出对应的更新离散余弦变换谱系数；若冲击位置不满足判断条件，则对音频码流进行标准的解码过程，得到标准离散余弦变换谱系数；根据更新离散余弦变换谱系数或标准离散余弦变换谱系数继续对音频码流进行解码，得到对应的音频信号。

7、可选的，若冲击位置满足判断条件，则对音频码流进行前回声抑制，并输出对应的更新离散余弦变换谱系数，包括：根据冲击位置构建全通滤波器；根据音频码流对应的标准离散余弦变换谱系数构建前回声抑制滤波器；根据全通滤波器对前回声抑制滤波器进行更新，并使用更新后的前回声抑制滤波器对标准离散余弦变换谱系数进行滤波，得到更新离散余弦变换谱系数。

8、可选的，根据冲击位置构建全通滤波器，根据音频码流对应的标准离散余弦变换谱系数构建前回声抑制滤波器，包括：根据冲击位置确定弯曲因子；根据弯曲因子构造全通滤波器；根据标准离散余弦变换谱系数计算对应的线性预测系数；根据线性预测系数构建前回声抑制滤波器。

9、第二方面，本申请提出一种优化音频编解码的系统，包括：编码器，其在音频编码过程中，确定音频信号对应的冲击信号，其中对音频信号进行分帧，并对得到的音频帧进行下采样；对进行下采样后的音频帧进行高通滤波；对高通滤波后的音频帧进行分块；计算各个分块对应的能量值；计算音频帧对应的能量包络；对音频帧进行冲击检测，若存在冲击信号则确定冲击位置；解码器，其在音频解码过程中，根据冲击位置对音频帧对应的音频码流进行前回声抑制。

10、第三方面，本申请提供一种计算机可读存储介质，其存储有计算机程序，其中计算机程序被操作以执行方案一中的优化音频编解码的方法。

11、第四方面，本申请提供一种计算机设备，其包括处理器和存储器，存储器存储有计算机程序，其中处理器操作计算机程序以执行方案一中的优化音频编解码的方法。

12、本申请通过将在编码端进行的时域噪声整形过程省略，取而代之的是音频信号中冲击位置的确定过程，将噪声抑制过程放在解码端进行，从而节省编码端的算力和带宽资源，减少音频卡顿。

技术特征：

1.一种优化音频编解码的方法，其特征在于，包括：

2.根据权利要求1所述的优化音频编解码的方法，其特征在于，所述在音频编码过程中，确定音频信号对应的冲击信号，还包括：

3.根据权利要求1所述的优化音频编解码的方法，其特征在于，所述对所述音频帧进行分块，包括：

4.根据权利要求1所述的优化音频编解码的方法，其特征在于，所述在音频编码过程中，确定音频信号对应的冲击信号，还包括：

5.根据权利要求1所述的优化音频编解码的方法，其特征在于，所述在音频解码过程中，根据所述冲击位置对所述音频帧对应的音频码流进行前回声抑制，包括：

6.根据权利要求5所述的优化音频编解码的方法，其特征在于，所述若所述冲击位置满足判断条件，则对所述音频码流进行前回声抑制，并输出对应的更新离散余弦变换谱系数，包括：

7.根据权利要求6所述的优化音频编解码的方法，其特征在于，所述根据所述冲击位置构建全通滤波器，根据所述音频码流对应的所述标准离散余弦变换谱系数构建前回声抑制滤波器，包括：

8.一种优化音频编解码的系统，其特征在于，包括：

9.一种计算机可读存储介质，其存储有计算机程序，其中所述计算机程序被操作以执行权利要求1-7中任一项所述的优化音频编解码的方法。

10.一种计算机设备，其包括处理器和存储器，所述存储器存储有计算机程序，其中所述处理器操作所述计算机程序以执行权利要求1-7中任一项所述的优化音频编解码的方法。

技术总结本申请公开了一种优化音频编解码的方法、系统、介质及设备，属于音频编解码技术领域，该方法包括：在音频编码过程中，确定音频信号对应的冲击信号，其中对音频信号进行分帧，并对得到的音频帧进行下采样；对进行下采样后的音频帧进行高通滤波；对高通滤波后的音频帧进行分块；计算各个分块对应的能量值；计算音频帧对应的能量包络；对音频帧进行冲击检测，若存在冲击信号则确定冲击位置；在音频解码过程中，根据冲击位置对音频帧对应的音频码流进行前回声抑制。本申请通过将在编码端进行的时域噪声整形过程省略，取而代之的是音频信号中冲击位置的确定过程，将噪声抑制过程放在解码端进行，从而节省编码端的算力和带宽资源，减少音频卡顿。技术研发人员：李强,王凌志,叶东翔,朱勇受保护的技术使用者：深圳百瑞互联技术有限公司技术研发日：技术公布日：2024/1/25