QMF域中的IVASSPAR滤波器组的制作方法
- 国知局
- 2024-08-05 11:52:32
本公开涉及针对用于处理多通道音频信号的表示的技术。具体地,本公开描述了利用在非常适于信号操作的在qmf组(例如,过采样的qmf组)的域中运行spar滤波器组来进行spar解码。
背景技术:
1、ivas spar是基于低时延核心编解码器的用于一阶环绕声(foa)和高阶环绕声(hoa)空间音频的低延迟编解码器。
2、沉浸式音频和视频服务(ivas)空间重构(spar)使用经修改的离散傅里叶变换(mdft)进行信号分析,并作为spar有限脉冲响应(fir)滤波器组的快速卷积内核。spar滤波器组由精心设计的、具有适于人类听觉系统的时间和频率分辨率的低延迟fir频带滤波器(通常为12个)组成。spar滤波器组在编码器处和解码器处运行。在编码器处,计算有源下混信号和残差信号,并将其与参数(例如,spar参数)一起发送到解码器。在解码器处,编码器侧的处理被反转,并利用所发送的参数来重构原始信号。为了可靠地重构信号,编码器和解码器处的滤波器组应该精确匹配。
3、另一方面,在解码器处使用过采样的qmf组可能比可能在精细时间网格下的sparmdft域(例如,参数化音频处理和解码)更适于信号操作。
4、因此,需要用于能够在qmf域中有效使用用于经spar解码内容的解码器滤波器组的技术。普遍需要能够在第二滤波器组的域使用第一滤波器组的滤波器的技术。
技术实现思路
1、鉴于此需要,本公开提供了用于处理多通道音频信号的表示的方法和装置,以及具有相应独立权利要求的特征的对应程序和计算机可读存储介质。
2、本公开的一方面涉及一种处理多通道音频信号的表示的方法。例如,该方法可以是计算机实施的。处理可以涉及解码,例如spar解码。多通道音频信号可以是空间音频信号,例如foa音频信号或hoa音频信号。表示可以包括第一通道和涉及第二通道的元数据。此外,多通道音频信号的表示可以包括多于一个第二通道。第一通道可以是传输通道(或被编码为传输通道的通道),并且第二通道可以是除传输通道(或被编码为传输通道的通道)以外的通道,具体地,是被参数化编码的通道。针对第一滤波器组的多个第一频带中的每一者,元数据可以包括用于基于该第一频带中的第一通道来针对第二通道进行预测的相应的预测参数(例如,增益参数)。该方法可以包括将具有多个第二频带的第二滤波器组应用到第一通道,以针对第二频带中的每一者获得该第二频带中的第一通道的频带化版本。第二滤波器组可以不同于第一滤波器组。该方法还可以包括针对第二频带中的每一者,基于预测参数和第一滤波器组的第一滤波器来生成相应的时域滤波器。其中,第一滤波器可以对应于第一频带。该方法还可以进一步包括基于第二频带中的第一通道的频带化版本和时域滤波器来生成针对第二通道的预测。这可以涉及例如针对第二频带中的每一者,基于该第二频带中的第一通道的经滤波版本来生成针对该第二频带中的第二通道的预测。其中,可以通过将该第二频带中的相应的时域滤波器应用到该第二频带中的第一通道的频带化版本来获得第一通道的经滤波版本。
3、因此,对原始多通道音频信号的重构和随后的音频处理不需要变换到第一滤波器组的域并随后变换到第二滤波器组的域。而是,第一滤波器组的滤波器可以在第二滤波器组的域中被“模拟”,从而避免了附加的转换步骤。这允许从用于编码的第一滤波器组(例如专门适于人类听力的频带等)的特定优势中获益,同时也从用于对经重构的多通道音频信号进行附加信号处理的第二滤波器组(例如更好的时间分辨率等)的特定优势中获益,而没有附加的计算负担。
4、在一些实施例中,多通道音频信号可以是一阶环绕声foa或高阶环绕声hoa音频信号。
5、在一些实施例中,预测参数可以是spar参数(例如,增益参数)。
6、在一些实施例中,第一滤波器组可以是包括fir频带滤波器的spar滤波器组,并且可以使用mdft。针对spar,例如可以存在12个第一频带。
7、在一些实施例中,第二滤波器组可以是qmf滤波器组。此外,第二滤波器组可以是过采样滤波器组,具体地,例如是过采样的qmf滤波器组。
8、在一些实施例中,时域滤波器可以是多抽头fir滤波器。
9、在一些实施例中,针对给定的第二频带生成时域滤波器可以包括基于相应的第一滤波器和用于滤波器转换的原型滤波器来生成多个适配的第一滤波器。
10、在一些实施例中,针对给定的第二频带l,针对给定的第一频带b的第一滤波器hb的适配的第一滤波器可以计算如下
11、
12、其中q是用于滤波器转换的原型滤波器,s是第二滤波器组的步幅,l是第二频带的数量,并且在用于滤波器转换的原型滤波器q的支持上对n进行求和。
13、在一些实施例中,该方法还可以包括基于第二滤波器组的原型滤波器来生成用于滤波器转换的原型滤波器。
14、在一些实施例中,可以基于第二滤波器组的原型滤波器通过求解最小二乘问题来生成用于滤波器转换的原型滤波器。
15、在一些实施例中,生成用于滤波器转换的原型滤波器可以包括基于第二滤波器组的原型滤波器p来生成非因果的原型滤波器pa。所述生成还可以包括生成非因果的原型滤波器pa和第二滤波器组的原型滤波器p的互相关p2。所述生成还可以包括针对某整数k生成矩阵集v(k),k=-k,…,k,该矩阵集的维数为s×r,并且仅针对索引n,m(其中,n-m为s的整数倍)具有非零元素vn,m,其中,r是用于滤波器转换的原型滤波器的长度。所述生成还可以进一步包括针对v(k)q来求解最小二乘问题集,其中q是包括用于滤波器转换的原型滤波器q的滤波器系数的维数为r×1的向量。
16、在一些实施例中,针对给定的第二频带生成时域滤波器还可以包括取适配的第一滤波器的加权和。其中,可以利用相应的第一频带的预测系数(例如,增益)来对适配的第一滤波器进行加权。
17、在一些实施例中,用于滤波器转换的原型滤波器可以是非对称原型滤波器。
18、在一些实施例中,针对每个抽头的处理步幅可以等于或小于第二频带的数量。
19、在一些实施例中,针对给定的第二频带生成时域滤波器可以包括通过第一和第二基本信号来近似给定的第一滤波器。其中,第一基本信号可以作为将第二滤波器组、基本实值单抽头滤波器和第二滤波器组的合成滤波器组应用于在相应的样本位置处具有单个非零样本的基本信号的结果来获得。基本实值单抽头滤波器可以是用于第二频带中的在相应的抽头位置处具有单个非零滤波器系数的相应单个频带的滤波器。此外,第二基本信号可以作为将第二滤波器组、基本虚单抽头滤波器和第二滤波器组的合成滤波器组应用于基本信号的结果来获得,其中,基本虚单抽头滤波器是用于第二频带中的在相应的抽头位置处具有单个非零滤波器系数的相应单个频带的滤波器。所述生成还可以包括基于近似中的第一和第二基本信号的系数针对第二频带中的第一滤波器生成适配的时域滤波器。
20、在一些实施例中,针对给定的第二频带生成时域滤波器可以包括获得将第二滤波器组、实值单抽头滤波器和第二滤波器组的合成滤波器组应用于信号xp(k)=δ(k-p)的结果up,l,k,其中,l指示给定的第二频带、p指示给定的样本位置,并且k指示滤波器抽头位置。所述生成还可以包括获得将第二滤波器组、虚单抽头滤波器和第二滤波器组的合成滤波器组应用与信号xp(k)=δ(k-p)的结果vp,l,k。所述生成还可以包括确定针对系数al和bl的最小二乘解,使得对于给定的延迟d3,
21、
22、其中,hb是用于第一频带b的第一滤波器,l是第二频带的数量,并且nl是用于第二频带l的滤波器抽头的预定义数量。所述生成还可以进一步包括以生成在第二频带l中的第一滤波器hb的适配的第一滤波器
23、在一些实施例中,该方法还可以包括截断时域滤波器的滤波器长度。
24、因此,可能可以在没有可感知影响的情况下降低计算复杂度。
25、在一些实施例中,给定的时域滤波器在截断后的滤波器长度可以取决于时域滤波器的相应的第二频带。
26、在一些实施例中,针对给定的第二频带生成时域滤波器可以涉及针对第一滤波器中的每一者生成给定的第二频带中的相应的基本(或适配的)时域滤波器(例如,适配的滤波器),并且基于给定的第二频带中的基本时域滤波器和预测参数生成给定的第二频带中的时域滤波器。然后,针对给定的第二频带的时域滤波器的截断可以基于基本时域滤波器的滤波器系数的阈值,其中,每个阈值与第一滤波器中的相应的一个滤波器相对应。可以从多个第二频带中的所述基本时域滤波器的最大幅度导出针对给定的第一滤波器的基本时域滤波器的阈值。
27、在一些实施例中,该方法还可以包括针对每个第一频带确定多个第二频带中的相对应的基本时域滤波器的最大幅度。该方法还可以包括针对每个第一频带,基于从所述最大幅度导出的阈值来确定多个第二频带中的相对应的基本时域滤波器的最小经截断的滤波器长度。该方法还可以进一步包括针对每个第二频带,基于该第二频带中的基本时域滤波器的最小经截断的滤波器长度来确定该第二频带中的时域滤波器的滤波器长度。
28、在一些实施例中,时域滤波器可以是单抽头fir滤波器。
29、通过采用单抽头fir滤波器,可以以最小的计算负担在第二滤波器组的域中模拟第一滤波器组的滤波器。
30、在一些实施例中,针对给定的第二频带生成时域滤波器可以包括在多个第一频带之间确定在该第二频带中具有最高能量的第一频带。所述生成还可以包括基于与所确定的第一频带相对应的第一滤波器的线性相位近似和针对所确定的第一频带的相对应的预测系数来生成时域滤波器。
31、在一些实施例中,针对给定的第二频带生成时域滤波器可以包括在多个第一频带之间确定在该第二频带中具有最高能量的第一频带集。所述生成还可以包括基于与所确定的第一频带集相对应的第一滤波器的线性相位近似的加权和来生成时域滤波器。其中,加权和中的权重可以取决于针对所确定的第一频带集的相对应的预测系数以及所确定的第一频带集中的第一频带在该第二频带中的相应的归一化幅度或能量。此处,应当理解归一化幅度或能量的求和归一。
32、根据另一方面,提供了一种生成多通道音频信号的表示的方法。该表示可以包括第一通道和与第二通道相关的元数据。针对第一滤波器组的多个第一频带中的每一者,元数据可以包括用于基于该第一频带中的第一通道来针对第二通道进行预测的相应的预测参数。该方法可以包括基于第一滤波器组的第一滤波器和预测参数来生成针对第二通道的预测。其中,针对第二通道的预测可以由时域信号(例如,预测信号)来表示。该方法还可以包括通过在时域中从第二通道减去对第二通道的预测来生成第二通道的残差。
33、在一些实施例中,多通道音频信号的表示还可以包括第二通道的残差。
34、根据另一方面,提供了一种用于处理多通道音频信号的表示的装置。该装置可以包括处理器和耦接到处理器并存储用于处理器的指令的存储器。处理器可以被配置为执行根据上述方面及其实施例所述的方法的所有步骤。
35、根据另一方面,描述了一种计算机程序。计算机程序可以包括在由计算设备执行时用于执行遍及本公开所概述的方法或方法步骤的可执行指令。
36、根据又一方面,描述了一种计算机可读存储介质。该存储介质可以存储计算机程序,该计算机程序被适配为在处理器上执行并且被适配为当在处理器上执行时执行遍及本公开所概述的方法或方法步骤。
37、应当注意,如本公开中所概述的方法和系统(包括其优选实施例)可以单独使用或与本文档中所公开的其他方法和系统结合使用。此外,本公开中所概述的方法和系统的所有方面都可以任意组合。具体地,权利要求的特征可以以任意的方式相互组合。
38、将理解的,装置特征和方法步骤可以以多种方式互换。具体地,如技术人员将理解的,所公开的一种或多种方法的细节可以通过相对应的装置来实现,并且反之亦然。此外,上述关于一种或多种方法(以及,例如其步骤)所做出的任何陈述被理解为同样适用于对应的装置(以及,例如其块、级、单元),并且反之亦然。
本文地址:https://www.jishuxx.com/zhuanli/20240802/259847.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表