用于在音频编码中使用滤波以频谱时间方式改善频谱间隙填充的方法和设备与流程
- 国知局
- 2024-11-06 14:39:54
根据本发明的实施例涉及用于在音频编码中使用滤波以频谱时间方式改善频谱间隙填充的方法和设备。根据本发明的实施例涉及用于在音频编码中使用不同噪声填充方法以频谱时间方式改善频谱间隙填充的方法和设备。根据本发明的实施例涉及用于在音频编码中使用倾斜以频谱时间方式改善频谱间隙填充的方法和设备。根据本发明的实施例涉及使用频谱倾斜信息用于音频编码的解码器、编码器和方法。根据本发明的其他实施例涉及使用预测滞后信息和/或使用滞后值和增益值和/或高频能量值或高频能量差量值用于音频编码的解码器、编码器和方法。根据本发明的其他实施例涉及使用滤波强度调适的解码器和方法。根据本发明的其他实施例涉及用于在音频编码中以频谱时间方式改善频谱间隙填充的方法和设备。
背景技术:
1、常规音频编码方法包括用于以随机频谱值填充频谱范围的零量化部分的技术。作为实例,感知噪声取代(pns)解码器可将伪随机值插入至零量化频带中,经缩放以使得插入信号能量匹配经发信号表示的目标能量。然而,对于此类方法,可能需要保留许多位以用于零量化频带能量的发信号表示。此外,仅全零量化频谱带可经取代,因此此类方法可能缺乏灵活性。
2、其他噪声填充方法可允许在解码后以高于某一“噪声填充开始频率”的伪随机值替代零量化频谱系数,然而,因此可能需要较大发信号表示开销,尤其在许多频带被零量化时。
3、因此,需要得到基于经编码音频信息的听觉印象与用于传输经编码音频信息的发信号表示工作量之间产生较佳折衷的概念。
4、这是通过本技术的独立权利要求的主题实现的。
5、根据本发明的其他实施例是由本技术的从属技术方案的主题定义。
技术实现思路
1、在下文中,根据各发明方面结构化地解释本发明的实施例。然而,应注意,以下结构化是出于解释性目的,以便促进理解本发明。
2、因此,应注意,根据根据本发明的任何方面的实施例的任何特征、功能性和/或细节可单独地或以组合方式与根据本发明的同一和/或另一方面的任何其他实施例一起使用和/或并入于其中。
3、此外,将在解码器的上下文中解释一些发明实施例,且将在编码器的上下文中解释其他发明实施例。应注意,在解码器的上下文中所解释的特征、功能性和细节可类似地单独地或以组合方式实施于对应编码器中、或添加至对应编码器、或与对应编码器一起使用。反之亦然,如对于本发明编码器所揭露的特征、功能性和细节可并入于对应解码器中。因此,应注意,解码器和对应编码器(或反之亦然)可基于类似和/或等效发明概念,且可因此包括对应优点。
4、此外,将在方法的上下文中解释其他发明方面。应注意,如在本发明编码器和/或解码器中的任一者的上下文中所解释的特征、功能性和/或细节中的任一者可单独地或以组合方式并入至本发明方法中的任一者、或可与本发明方法中的任一者一起使用、或可添加至本发明方法中的任一者。此外,根据本发明的实施例的方法可基于与对应编码器和/或解码器相同或类似或相似的考虑因素和/或构想。因此,这些方法可包括相同或类似或相似的特征和优点。
5、根据以上解释,出于简洁和简明起见,可以在根据特定方面的实施例之上下文中对一些特征、功能性和细节进行解释或揭露,或编码器而不是译码器或反之亦然来解释或揭露,或根据方法。因此,此外,应强调,实施例的任何特征、功能性和/或细节可单独地或以组合方式并入根据本发明的任何其他实施例、或与根据本发明的任何其他实施例一起使用、或添加至根据本发明的任何其他实施例。
6、方面1
7、根据本发明的第一方面的实施例包括一种用于基于经编码音频信息提供经解码音频信息的音频解码器,其中该音频解码器被配置为从该经编码音频信息导出频谱倾斜信息,例如t'sf。此外,该音频解码器被配置为使用填充值(例如间隙填充系数;例如噪声填充的噪声值;例如智能型间隙填充的间隙填充值),以便填充经解码频谱值集合的频谱孔。
8、此外,该音频解码器被配置为例如以乘法方式将频谱倾斜是由频谱倾斜信息确定的频率可变缩放应用于该等填充值,例如应用于取代零量化样本的噪声样本,其中作为实例,该频率可变缩放的频谱倾斜是由频谱倾斜信息确定的。
9、发明人认识到,经解码音频信息的质量可使用用于填充经解码频谱值集合的频谱孔的填充值的频率可变缩放来改善。因此,根据本发明的实施例的音频解码器可被配置为从基于可确定频率可变缩放的经编码音频信息导出频谱倾斜信息。
10、举例而言,根据本发明第一方面的实施例的一个主要构想是计算和例如低比特率发信号表示例如在对数强度域中,在帧的(和/或子帧的)(例如,真实)频谱包络(例如,其输入信号包络)与帧的(和/或子帧的)遮蔽包络(例如,其噪声塑形包络)之间的差异曲线。由于可将遮蔽包络传输至解码器,例如,差异的额外传输可允许在频谱孔填充程序中(例如,在间隙或噪声填充解码程序中)从遮蔽包络和差异曲线重构(例如真实)频谱包络。因此,根据本发明,差异曲线可由频谱倾斜信息表征。使用对应发明性解码器,音频信息的良好准确度和/或质量可例如以少数旁侧信息位实现。
11、频谱倾斜信息可例如为逐帧和/或逐子帧频谱倾斜信息。作为实例,频谱倾斜信息可包括倾斜索引,例如tsf,作为实例,可基于该倾斜索引确定信息t'sf,其中t'sf可例如与频率依赖项(例如,f)相乘例如以便将频率可变缩放应用于填充值。任选地,可不传输零量化非重叠频率范围中的目标能量的显式传输,因此可将发信号表示工作量保持在低水平处。
12、发明人认识到,使用频谱倾斜,音频信息的频谱包络可以用仅少数额外发信号表示位从音频信息的遮蔽包络(例如,噪声塑形包络,例如,对应于或相关联于帧和/或子帧的缩放值或缩放因子的遮蔽包络)恢复。
13、根据根据本发明第一方面的其他实施例,音频解码器被配置为从经编码音频信息导出噪声水平信息(例如,lsf),且音频解码器被配置为例如除了频率可变缩放之外还使用该噪声水平信息,以便获得填充值。
14、举例而言,噪声水平信息(例如,lsf)可从噪声水平索引导出或重构,例如n位噪声水平索引0≤lsf<2n。举例而言,噪声水平信息和/或噪声水平索引可从对应编码器传输至解码器。作为实例,噪声水平信息和/或噪声水平索引可例如包括关于频谱倾斜信息的信息(例如,即,关于差异曲线的其他信息),例如偏移,例如osf。换言之,解码器可被配置为从噪声水平信息和/或从噪声水平索引导出关于频谱倾斜信息的信息(例如,即,关于差异曲线的其他信息)。
15、发明人认识到,使用噪声水平信息用于解码可允许确定改善的填充值,例如允许经编码音频信号的良好重构。
16、根据根据本发明第一方面的其他实施例,该音频解码器被配置为应用该频率可变缩放,使得该频率可变缩放在对数强度标度上例如在为+/-3db或+/-2db或+/-1db的公差内描述(例如填充值的)强度随频率增大的线性减小。
17、发明人认识到,在对数强度标度上使用或借由强度随着频率增大的线性减低,可实现音频信息的频谱包络的改善重构。作为实例,可补偿在音频信息的遮蔽包络的计算期间所应用的预加重倾斜的影响,使得可至少大致恢复频谱包络。
18、根据根据本发明第一方面的其他实施例,频谱倾斜信息描述对数域中的频谱倾斜,例如其中频谱倾斜(例如,频谱倾斜信息)可例如用于对数域和/或线性域中。
19、应注意,根据本发明的实施例不限于对数域中的频谱倾斜信息。频谱倾斜信息可例如用于对数域和/或线性域中。在对数域中的使用可允许以低计算成本计算(例如经频谱倾斜的)填充值。
20、根据根据本发明第一方面的其他实施例,该频谱倾斜信息描述对数域中具有频谱倾斜的线函数。
21、发明人认识到,对数域中具有频谱倾斜的这种形式的函数允许以良好准确度有效地解码音频信息。
22、根据根据本发明第一方面的其他实施例,音频解码器被配置为在对数域中获得用于频率可变缩放的缩放值,且音频解码器被配置为例如使用指数函数(例如使用以10为底的指数函数;例如使用形式10x的函数)将用于频率可变缩放的缩放值从对数域转换至线性域。
23、根据本发明的实施例,计算域(例如,对数域或线性域)可例如经改变或经调适用于不同处理步骤。发明人认识到,域的这种切换或改变可改善本发明的音频编码概念的灵活性。此外,通过在相应适合域中执行不同处理步骤可以减少计算成本。
24、根据根据本发明第一方面的其他实施例,音频解码器被配置为取决于基于该倾斜信息的倾斜值(例如,t'sf)与频率值(例如f,例如描述该频率的频率值或描述相对于参考值的频率偏移的频率值)的乘积而获得用于频率可变缩放的缩放值。
25、作为实例,倾斜值可例如由常数(例如额外常数)缩放,以便平均维持噪声水平信息(例如lsf)的值范围。发明人认识到,用于频率可变缩放的缩放值可例如使用倾斜值与频率值的乘积以低计算工作量获得。
26、根据根据本发明第一方面的其他实施例,音频解码器被配置为获得与不同频带相关联的用于频率可变缩放的多个缩放值,例如使得缩放值与不同频带相关联。
27、发明人认识到,使用与不同频带相关联的缩放值,音频信息的解码可在例如复杂度或灵活性方面得以改善。
28、根据根据本发明第一方面的其他实施例,音频解码器被配置为使用相应频带的开始频率或使用相应频带的中心频率获得用于频率可变缩放的缩放值;其中,例如,与第一频带相关联的缩放值是使用第一频带的(例如,较低)开始频率与倾斜值的乘法获得的,且其中,例如,与第二频带相关联的缩放值是使用第二频带的(例如,较低)开始频率与倾斜值的乘法获得的;或其中,例如,与第一频带相关联的缩放值是使用第一频带的中心频率与倾斜值的乘法获得的,且其中,例如,与第二频带相关联的缩放值是使用第二频带的中心频率与倾斜值的乘法获得的。
29、应注意,根据本发明的实施例不限于对相应频带的频率表示的特定选择。如之前所解释,可使用开始频率和/或中心频率。然而,可实施频带信息的其他(例如应用特定)有利选择。因此,根据实施例的本发明概念可提供高灵活性。
30、根据根据本发明第一方面的其他实施例,音频解码器被配置为使用相应频带的开始频率区间索引或使用相应频带的中心频率区间索引获得用于频率可变缩放的缩放值;其中,例如,与第一频带相关联的缩放值是使用第一频带的(例如,较低)开始频率区间索引与倾斜值的乘法获得的,且其中,例如,与第二频带相关联的缩放值是使用第二频带的(例如,较低)开始频率区间索引与倾斜值的乘法获得的;或其中,例如,与第一频带相关联的缩放值是使用第一频带的中心频率区间索引与倾斜值的乘法获得的,且其中,例如,与第二频带相关联的缩放值是使用第二频带的中心频率区间索引与倾斜值的乘法获得的。
31、发明人认识到,使用频率区间索引(例如,替代频率值)可允许降低计算成本。
32、根据根据本发明第一方面的其他实施例,音频解码器被配置为使用噪声强度信息(例如,lsf)来获得填充值;例如,使用频率非依赖噪声缩放值,该频率非依赖噪声缩放值可例如从经编码音频信息导出;该经编码音频信息可例如从lsf导出。
33、因此,音频解码器可例如被配置为使用噪声水平信息和/或噪声强度信息确定或获得填充值。任选地,解码器可例如被配置为导出噪声强度信息。在一些应用中,噪声水平信息可例如等于噪声强度信息。
34、根据根据本发明第一方面的其他实施例,音频解码器被配置为使用噪声值、频率非依赖噪声缩放值(例如lsf)与在考虑频谱倾斜的情况下确定的频率可变噪声缩放值(例如,10t'sf*f)的乘法获得填充值;其中该噪声值为随机噪声值或伪随机噪声值,例如,具有预定振幅或具有在预定振幅范围内的振幅。
35、发明人认识到,用频率非依赖噪声缩放值和基于频谱倾斜的频率可变噪声缩放值调适噪声值可改善经解码音频信息的质量,而对相应解码器的复杂度仅具有有限影响。频率可变噪声缩放值可允许塑形(例如,相对于频率而倾斜)音频信息的遮蔽包络,以便更佳地近似得出原先经编码音频信息的频谱包络。
36、根据根据本发明第一方面的其他实施例,音频解码器被配置为将基于遮蔽包络的缩放应用于例如非零解码频谱值且应用于填充值,例如使得实际上遮蔽包络应用于完整频谱,任选地包括填充值。
37、发明人认识到,例如,本发明缩放的应用可在不仅填充值而且其他经解码频谱值受到缩放影响时改善经解码音频信息。因此,音频信息的经解码频谱可例如经调适,例如取决于频率而倾斜。
38、根据本发明第一方面的其他实施例包括一种用于基于输入音频信息提供经编码音频信息的音频编码器,其中音频编码器被配置为编码多个经量化频谱值,且其中音频编码器被配置为基于例如频谱包络的频谱能量信息和遮蔽包络信息确定频谱倾斜信息(例如,描绘在对数域中具有频谱倾斜的线函数的频谱倾斜信息,例如其中频谱倾斜(例如频谱倾斜信息)可例如用于对数域和/或线性域中),例如使得频谱倾斜信息描述频谱能量与遮蔽包络之间的差异的平均频率变化。此外,音频编码器被配置为编码频谱倾斜信息。
39、如前所解释,频谱倾斜信息可描述音频信息的频谱能量与用于编码音频信息的遮蔽包络之间的形状差异。此形状差异可例如以频率依赖倾斜(在频率-振幅平面中)的形式表达。因此,频谱倾斜信息可传输至对应的解码器,且频谱倾斜信息可例如用作校正因子以调适所传输的遮蔽包络,以便更佳地重构音频信息的频谱包络。
40、根据根据本发明第一方面的其他实施例,音频编码器被配置为确定该频谱倾斜信息,使得该频谱倾斜信息描述频谱能量信息(例如“真实频谱包络”或频谱值的平滑化(例如,在频率方向上)版本)与遮蔽包络信息(例如表示为缩放因子或一个或多个预测系数)之间的差异随频率的频率变化,例如使得倾斜信息描述频率变化的平均值,或例如,使得倾斜信息描述频谱能量信息与遮蔽包络信息之间的差异随频率的(例如,线性)回归线的倾斜。
41、如前所解释,根据本发明的实施例的构想是计算和低比特率发信号表示(例如在对数强度域中)在帧的(和/或子帧的)(例如,真实)频谱能量(例如频谱包络,例如其输入信号包络)与帧的(和/或子帧的)遮蔽包络之间的频率变化,例如差异曲线。使用频谱倾斜信息可传输此信息。因此,作为实例,通过提供遮蔽包络和频谱倾斜信息且因此提供关于该差异曲线的信息,可以良好准确度且以低发信号表示工作量执行音频信息的频谱能量的重构。这可特别地改善零量化频谱系数的重构,这是因为经噪声填充或频谱间隙填充的系数(在对应解码器中)可例如使用频谱倾斜信息加以调适或校正,因此减小“初始”频谱与音频信息的经重构或经解码频谱之间的差异。
42、根据根据本发明第一方面的其他实施例,该频谱倾斜信息描述在对数域中具有频谱倾斜的线函数。发明人认识到,这可允许发信号表示用于遮蔽包络的校正信息,以较少发信号表示位和良好准确度更佳地近似得出音频信息的原始频谱。
43、根据根据本发明第一方面的其他实施例,音频编码器被配置为例如使用频谱能量信息的对数化(例如频率依赖)表示且例如使用遮蔽包络信息的对数化(例如频率依赖)表示来在对数域中确定频谱倾斜信息。
44、如前所解释,发明人认识到,在对数域中对频谱倾斜信息的确定可以计算方式有效地执行。
45、根据根据本发明第一方面的其他实施例,音频编码器被配置为基于可构成频谱能量信息的频谱包络的对数化表示(例如随频率而变)与可构成遮蔽包络信息的遮蔽包络的对数化表示(例如随频率而变)之间的差异(例如差异曲线(f)=真实频谱包络(f)-遮蔽包络(f),例如频率依赖差异)确定频谱倾斜信息。
46、发明人认识到,在对数域中对频谱倾斜信息的确定可作为例如简单且可有效实施的差异操作而执行。
47、根据根据本发明第一方面的其他实施例,音频编码器被配置为使用线性回归获得频谱倾斜信息,其中频谱倾斜信息可例如为通过例如在对数强度域中的(真实)频谱包络与遮蔽包络之间的差异随频率的演进的线性回归获得的回归系数。
48、发明人认识到,线性回归可允许以有限复杂度和良好近似结果近似得出(例如真实)频谱包络与遮蔽包络之间的校正项或差异项或(例如单调)差异曲线。基于校正项或差异项或例如单调差异曲线,可例如获得频谱倾斜信息。任选地,校正项或差异项或例如单调差异曲线可为频谱倾斜信息。
49、根据根据本发明第一方面的其他实施例,音频编码器被配置为基于表示多个相应频谱带中的频谱值的能量的逐频谱带(例如加总)能量值或逐频谱带均方根值且基于表示例如多个相应频谱带中的遮蔽阈值的能量水平的逐频谱带(例如加总)能量值或逐频谱带均方根值来获得该频谱倾斜信息。
50、发明人认识到,用于获得频谱倾斜信息的逐频谱带能量值(例如,平方和)或均方根(rms)值的表示的使用可允许将计算复杂度保持为低。然而,实施例不限于使用这样的表示,因此也可使用逐变换系数值。
51、根据根据本发明第一方面的其他实施例,音频编码器被配置为针对不同音频帧和/或针对不同音频子帧确定单独的频谱倾斜信息,例如单独的频谱倾斜值。
52、发明人认识到,逐帧或逐子帧频谱倾斜信息可允许确定有效校正信息,例如待传输至对应解码器的频谱倾斜,以便改善音频信息的经解码频谱与音频信息的原始频谱的拟合。
53、根据根据本发明第一方面的其他实施例,音频编码器被配置为确定在包括多个频谱区间的频率范围内(例如在频带上,或甚至在多个频谱带上,或甚至在所有频带上)以单一值的形式表示频谱能量信息与遮蔽包络信息之间的差异的差值(例如,osf或tsf,例如偏移值osf;或例如倾斜值tsf,例如量化例如至值tsf、和/或可例如传输至例如噪声填充解码器、和/或可例如以例如否定形式用于噪声填充编码器中的值)。此外,音频编码器被配置为获得噪声水平信息,其可例如描述取决于差值的在多个频谱带上或甚至所有频带上的噪声水平,例如lsf。
54、举例而言,osf可为偏移,其可能实际上是不需要的或可能不需要被编码(但可任选地被使用)。举例而言,tsf可为经量化(例如,为tsf)且可经传输的值,且其可例如在噪声填充编码器中(和/或在噪声填充解码器中)使用(例如,以否定形式)。
55、发明人认识到,使用单一差值可提供音频信息的(例如,发信号表示或传输)复杂度与重构准确度之间的良好折衷。作为实例,可确定可描述遮蔽包络相对于音频信息的原始频谱在频率上的倾斜的倾斜信息。因此,例如根据遮蔽包络调适且使用倾斜信息校正的基于填充值的零量化频谱系数的解码器侧校正可允许有效音频信息重构。
56、根据根据本发明第一方面的其他实施例,音频编码器被配置为使用线性回归,例如使用上文提及的线性回归获得差值(例如,osf或tsf,例如偏移值osf;或例如倾斜值tsf,例如量化例如至值tsf、和/或可例如传输至例如噪声填充解码器、和/或可例如以例如否定形式用于噪声填充编码器中的值)。
57、发明人认识到,例如,在许多应用中,原始(例如“真实”)音频信号频谱包络与遮蔽包络之间的差异可包括大致线性的(例如在对数频域中)特性。换言之,真实频谱包络与遮蔽包络之间的强度差异可随频率单调地改变。例如,在对数强度域(例如,以10为底的对数)中且在间隙或噪声填充频谱区中,单调差异曲线可在大部分时间类似于直线。因此,使用线性回归可允许以低计算成本和良好准确度近似得出对应差值。
58、根据根据本发明第一方面的其他实施例,音频编码器被配置为使用三个位来编码频谱倾斜信息。
59、这可允许发信号表示位的数目与频谱倾斜信息的准确度之间的良好权衡。
60、根据根据本发明第一方面的其他实施例,音频编码器被配置为编码频谱倾斜信息,使得经编码频谱倾斜信息始终表示负频谱倾斜,例如随频率增大而减小。
61、发明人认识到,负频谱倾斜可例如允许经重构音频信息的良好调适或校正或改善。作为实例,用负频谱倾斜信息进行的填充值的校正可补偿预加重的不合需要的影响。
62、根据根据本发明第一方面的其他实施例,音频编码器被配置为针对一个或多个帧或子帧sf(例如,音频帧或音频子帧)执行以下功能性:
63、1.从输入(例如未经编码)频谱计算逐频谱带能量值或rms值esf(f);
64、2.将一个或多个值esf(f)转换至对数域且从值esf(f)或例如从其对数化版本减去多个值esf(f)或例如其对数化版本的总体平均值,以获得零平均值e'sf(f);
65、3.从零平均值e'sf计算、量化和解量化遮蔽包络msf;
66、4.从msf重构逐频谱带能量值或rms值,且从msf导出对数(或例如,对数化)和零平均值m'sf(f);
67、5.在成对的逐频谱带e'sf与m'sf之间进行线性回归,以便获得斜率tsf和偏移osf;
68、6.从tsf量化且解量化倾斜索引tsf;
69、7.从tsf重构倾斜值以获得经解码倾斜t'sf,且使用-t'sf*f用于计算噪声水平索引isf。
70、发明人认识到,上述功能性可允许音频信息的有效编码。
71、根据本发明第一方面的其他实施例包括一种用于基于经编码音频信息提供经解码音频信息的方法,该方法包括:从经编码音频信息导出频谱倾斜信息,例如t'sf;和使用填充值(例如间隙填充系数;例如噪声填充的噪声值;例如智能型间隙填充的间隙填充值),以便填充经解码频谱值集合的频谱孔。该方法进一步包括例如以乘法方式将频谱倾斜是通过频谱倾斜信息而确定的频率可变缩放应用于填充值,例如应用于取代零量化样本的噪声样本。
72、根据本发明第一方面的其他实施例包括一种用于基于输入音频信息提供经编码音频信息的方法,该方法包括:编码多个经量化频谱值;和基于频谱能量信息(例如频谱包络)和遮蔽包络信息确定频谱倾斜信息,例如使得该频谱倾斜信息描述该频谱能量与该遮蔽包络之间的差异的平均频率变化。该方法进一步包括编码频谱倾斜信息。
73、根据本发明第一方面的另外实施例包括一种计算机程序,其用于当计算机程序在计算机上运行时执行以上方法中的任一者。
74、方面2
75、根据本发明第二方面的实施例包括一种用于基于经编码音频信息提供经解码音频信息的音频解码器,其中音频解码器被配置为例如使用基于相应填充值量化为零的频谱系数的取代来填充经解码频谱值集合的频谱孔。此外,音频解码器被配置为例如从位串流或从该经编码音频信息获得预测滞后信息,例如频域长预测滞后值psf;例如,指示频率方向上的预测周期的预测滞后信息,例如频谱(ltp,例如,长期预测)距离值psf。
76、此外,音频解码器被配置为取决于预测滞后信息而在第一频谱填充方法(例如“噪声填充”+fd ltp,例如若psf不为零)与一个或多个其他频谱填充方法(例如,第二频谱填充方法或第三频谱填充方法,例如无fd-ltp的“噪声填充”;例如“间隙填充”,例如若psf为零)之间切换,在该第一频谱填充方法中,使用频率滤波或频率预测(例如tns或ltp(例如,其中与第一频率相关联的频谱值对与第二频率相关联的频谱值具有影响的滤波)来获得用以填充频谱孔的填充值,且在该一个或多个其他频谱填充方法中,不使用频率滤波且不使用频率预测(例如既不使用频率滤波也不使用频率预测)来获得用以填充频谱孔的填充值。
77、根据本发明第二方面的实施例的构想是例如基于(例如,子)帧的信号特性,适应性地在第一频谱填充方法(例如,噪声填充解决方案)与第二(或多个第二,例如,第二和第三)频谱填充方法(例如,间隙填充解决方案)之间的切换。此外,第一频谱填充方法可包括频率滤波或频率预测,例如频率域长期预测(fd-ltp),且第二频谱填充方法可不包括频率滤波和频率预测。因此,解码器可例如在用于产生用于填充零量化频谱系数的“人工”频谱内容的不同方法之间切换。
78、发明人认识到,在不同填充方法之间的切换可改善经重构(例如,经解码)音频信号。此外,发明人发现,预测滞后信息可允许在仅对发信号表示复杂度具有有限影响的情况下控制不同填充方法的调适。作为实例,根据实施例的解码器可被配置为取决于预测滞后信息,例如取决于fd-ltp滞后值psf而在具有fd-ltp的噪声填充与无fd-ltp的基于调性的间隙填充(例如,类似于evs中的igf)或无fd-ltp的噪声填充(例如,类似evs或mpeg-d中的噪声填充)之间切换或选择。
79、作为另一任选特征,预测滞后信息可例如包括例如仅整数值,以便降低计算复杂度。
80、因此,根据本发明第二方面的发明性编码概念可例如在切换或选择频谱孔填充方法时提供良好灵活性,以便实现用于音频信息的较佳编码效率。
81、预测滞后信息可包括关于不同频率区块的(例如零量化的)频谱系数的关系的信息。预测滞后信息可包括关于周期性或关于频谱系数的减少的信息。因此,预测滞后信息可例如为(例如零量化的)频谱系数之间的关系是否足够或适合,以便取决于对应相关频谱系数重构或近似得出频谱系数的指示符。在此情况下,可例如实现良好听觉印象,但可节省位。
82、特别地,作为实例,发明人以实验方式发现,例如,鼓掌类、下雨类和低频lf男性语音信号可受益于在解码器侧频谱孔填充(例如间隙或噪声填充)期间的高频hf精细时间信号包络的改善的重构。对于可例如经检测并分类为“长期瞬态”(例如,使用预测滞后信息而经分类)的这种信号,特定(例如,子)帧的精细时间结构可通过例如频域长期预测(fd-ltp)信息的预测滞后信息参数化。类似于例如时域(td)中获取的常规ltp音调和增益信息,作为实例,预测滞后信息滞后和增益值(例如fd-ltp滞后和增益值)可(例如直接)在音频编码解码器的变换域中获得。待应用于解码器中的频谱孔填充的选择可取决于在音频位串流中传输的所述预测滞后信息(例如fd-ltp滞后p或psf)的值而作出并被发信号表示给解码器。
83、根据根据本发明第二方面的其他实施例,音频解码器被配置为在预测滞后信息(例如预测滞后值,例如经量化fd ltp滞后值,例如长期预测滞后值;例如psf)为非零的情况下(例如选择性地)使用第一频谱填充方法。替代地或例如另外,音频解码器被配置为在预测滞后信息(例如预测滞后值;例如经量化fd ltp滞后值;例如psf)大于零的情况下(例如选择性地)使用第一频谱填充方法。此外,音频解码器被配置为例如在预测滞后信息为零、或预测滞后信息小于或等于零的情况下(例如选择性地)使用一个或多个其他频谱填充方法中的一者。
84、发明人认识到,预测滞后信息可允许实施情况的简单区别。作为实例,在(例如零量化)频谱系数之间的关系对于重构带来优点(例如,时间信号的较佳重构)的情况下,预测滞后信息可为非零或大于零。否则,解码器可例如使用第二频谱填充,例如在预测滞后信息为零的情况下,其可与频谱系数之间的小依赖性相关联。
85、根据根据本发明第二方面的其他实施例,音频解码器被配置为使用包括于经编码音频信息中的预测滞后值的经编码表示(例如,经量化且经编码表示),以便获得该预测滞后值。
86、根据根据本发明第二方面的其他实施例,当使用第一频谱填充方法时,音频解码器被配置为使用预测或滤波(例如使用计算规则d*c(i)+g'sf*c(i-p'sf))确定(例如最终)填充值(例如用于c(i)的替代,例如),使得与给定频率(例如与给定频率区间)相关联的给定填充值(例如)是取决于与不同频率(例如,与不同频率区间,例如与具有频率区间索引i-p'sf的不同频率区间,例如与与给定频率或与给定频率区间相距频谱距离p'sf或频谱距离dsf的频率或频率区间)相关联的另一频谱值(例如c(i-p'sf)或)而获得。
87、此外,当使用第一频谱填充方法时,音频解码器被配置为取决于与不同频率(例如,与不同频率区间;例如与具有频率区间索引i-p'sf的不同频率区间)相关联的经编码或经量化频谱值(例如,例如最初是由经编码音频信息中的各个频谱值的经编码表示确定、例如由在应用噪声填充之前的频谱值确定、例如由直接在算术解码之后的频谱值确定的频谱值)调适滤波强度(例如,与不同频率相关联的频谱值的加权,例如通过将滤波强度选择性地设定为g'sf或1/2g'sf)。
88、如前所解释,例如在预测滞后信息为非零的情况下,与给定频率相关联的填充值可基于或使用与不同频率相关联的频谱值来确定或获得或计算,且因此作为实例,指示信号的瞬态性。此外,发明人认识到,音频信息的解码和/或重构可通过取决于与不同频率相关联的经编码或经量化频谱值调适滤波强度来改善。
89、作为实例,在选择第一频谱填充方法的情况下,例如在选择具有fd-ltp的噪声填充的情况下(例如,若预测滞后信息为非零,作为实例,若fd-ltp滞后为非零),在解码器侧噪声填充例程期间(例如,取决于“当前”经编码fd系数是否为零且取决于位于与当前系数相距一定距离(由经传输预测滞后信息指定,例如由所传输fd-ltp滞后指定)处的对应“先前”经编码fd系数是否为零)可执行在音频变换编码解码器的频谱域(例如mdct域)中应用长期预测性滤波器。
90、作为实例,无限脉冲响应(iir)ltp类滤波器可用于滤波。
91、根据根据本发明第二方面的其他实施例,滤波强度确定例如c(i-p'sf)的另一频谱值对给定填充值的影响。
92、发明人认识到,基于滤波强度调适另一频谱值对给定填充值的影响可改善经解码音频信息的质量。
93、根据根据本发明第二方面的其他实施例,音频解码器被配置为取决于与不同频率相关联的频谱值(该频谱值(例如最初)是由经编码音频信息中的各个频谱值的经编码表示确定)调适滤波强度。
94、发明人认识到,使用由用于调适滤波强度的经编码表示表示的值允许使用或利用由经编码表示而非其经滤波版本(其可例如经交替)提供的信息。已发现,使用这样的准则,相比于使用取决于在解码器侧上已经预处理的值的准则,对于滤波强度的选择更可靠。
95、根据根据本发明第二方面的其他实施例,音频解码器被配置为取决于在应用噪声填充之前与不同频率相关联的频谱值来调适滤波强度。
96、发明人认识到,在噪声填充之前使用与不同频率相关联的频谱值可允许基于频谱值是否经量化为零的信息来调适滤波强度。
97、根据根据本发明第二方面的其他实施例,音频解码器被配置为取决于与该不同频率(或值)相关联的频谱值是否量化为零而调适滤波强度。
98、根据根据本发明第二方面的其他实施例,音频解码器被配置为取决于是否将噪声填充应用于与不同频率(或值)相关联的频谱值而调适滤波强度。
99、发明人认识到,使用这种准则,例如,除了基于针对频谱值的相应频率是否试图执行或已执行噪声填充以外,可还基于是否已将相应频谱值量化为零的信息,来执行滤波强度调适。这可包括使用旗标。
100、根据根据本发明第二方面的其他实施例,音频解码器被配置为对于针对其应用噪声填充的频谱值(例如针对位置i>=p'sf处的每一噪声填充零量化频谱系数c)选择性地应用频率方向上的滤波或频率方向上的预测。
101、发明人认识到,作为实例,可基于或使用频率方向上的滤波或预测来近似得出或估计零量化频谱值。因此,可例如利用不同频谱值中的频谱值在频率方向上的依赖性。
102、根据根据本发明第二方面的其他实施例,音频解码器被配置为应用预测或滤波,以便基于随机或伪随机噪声值(例如c(i))确定给定(例如最终)填充值,例如
103、发明人认识到,随机或伪随机噪声值可例如使用预测或滤波来调适,以便计算可提供用于音频信息的(例如原始)例如输入频谱的零量化频谱值的良好近似的(例如最终)填充值。
104、根据根据本发明第二方面的其他实施例,音频解码器被配置为执行与给定频率相关联的噪声值和与另一频率相关联的噪声值的加权组合,以便获得给定(例如最终)填充值,例如
105、作为实例,音频解码器可被配置为执行组合d*c(i)+g'sf*c(i-p'sf),其中噪声值c(i)的权重d与给定频率相关联,且噪声值的权重g'sf与另一频率相关联,或执行组合d*c(i)+1/2*g'sf*c(i-p'sf),其中噪声值c(i)的权重d与给定频率相关联,且噪声值的权重1/2*g'sf与另一频率相关联。
106、或者,音频解码器被配置为执行与给定频率相关联的噪声值和与另一频率相关联的填充值的加权组合,以便获得给定(例如最终)填充值,例如
107、此外,音频解码器被配置为取决于噪声填充是否已应用于与另一频率相关联的频谱值而调整给定至与另一频率相关联的噪声值的权重(例如g'sf或1/2*g'sf)或给定至与另一频率相关联的填充值的权重(例如g'sf或1/2*g'sf)。
108、如上所解释,发明人认识到,(例如最终)填充值可例如使用例如与给定频率相关联的和/或与另一频率相关联的噪声值和/或与另一频率相关联的填充值的不同频率依赖性量来计算。因此,本发明概念可允许确定或获得或计算具有良好灵活性的(例如最终)填充值,使得根据特定情形,可获得可良好或甚至最佳地适合于(例如原始)音频信息频谱的重构的填充值。举例而言,可基于预测滞后信息执行待用于获得(例如最终)填充值的相应量的选择。此外,发明人认识到,与另一频率相关联的对应噪声值或填充值的相应权重的调适或调整可改善(例如最终)填充值的确定,且因此改善音频信息的重构。
109、根据根据本发明第二方面的其他实施例,该音频解码器被配置为执行与给定频率相关联的噪声值和与另一频率相关联的噪声值的加权组合,以便获得给定(例如最终)填充值,例如
110、作为实例,音频解码器可被配置为执行组合d*c(i)+g'sf*c(i-p'sf),其中噪声值c(i)的权重d与给定频率相关联,且噪声值的权重g'sf与另一频率相关联,或执行组合d*c(i)+1/2*g'sf*c(i-p'sf),其中噪声值c(i)的权重d与给定频率相关联,且频谱(或噪声)值的权重1/2*g'sf与另一频率相关联。
111、或者,音频解码器被配置为执行与给定频率相关联的噪声值和与另一频率相关联的填充值的加权组合,以便获得给定(例如最终)填充值,例如
112、此外,音频解码器被配置为取决于是否已针对与另一频率相关联的频谱值应用噪声填充而调整给定至与另一频率相关联的噪声值或给定至与另一频率相关联的频谱值的权重(例如g'sf或1/2*g'sf)或调整给定至与另一频率相关联的填充值或给定至与另一频率相关联的频谱值的权重(例如g'sf或1/2*g'sf)。
113、根据根据本发明第二方面的其他实施例,音频解码器被配置为基于描述包括于音频信息的经编码表示中的频谱距离的经编码信息(例如经编码值)确定与给定频率相关联的填充值和与不同频率相关联的另一频谱值之间的频谱距离,例如p'sf(例如,基于p'sf的频谱距离dsf)。
114、作为实例,可对填充值(例如,噪声样本,例如取代零量化样本的)进行滤波,使得滤波强度取决于位于与i相距频谱距离dsf处的经量化值c(i-dsf)。在使用fd-ltp的情况下,dsf可等于p'sf。
115、发明人认识到,可例如使用频谱距离以便改善对频谱填充值的确定。
116、根据根据本发明第二方面的其他实施例,音频解码器被配置为基于包括于音频信息的经编码表示中的增益信息(例如,增益值,例如,gsf)确定应用于与给定频率相关联的噪声值的权重(例如,d),其中应用于与给定频率相关联的噪声值的权重为正值,例如在0.5与1之间的范围内。
117、发明人认识到,权重的这种确定和应用可例如允许调整与给定频率相关联的噪声值,以便更佳地近似得出音频信息的原始频谱包络。
118、根据根据本发明第二方面的其他实施例,音频解码器被配置为取决于包括于音频信息的经编码表示中的增益信息(例如增益值,例如gsf)确定应用于与另一频率相关联的噪声值(例如c(i-p'sf))或应用于与另一频率相关联的填充值的权重(例如gsf=(-1)ssf*(3+2*gsf)/8或1/2*gsf),其中应用于与给定频率相关联的噪声值的权重例如为正或负值,例如具有在0.25与0.75之间的绝对值。
119、发明人认识到,相应噪声值或与另一频率相关联的相应填充值可例如用取决于增益信息确定的权重加以调适。这可允许对所述噪声或填充值进行塑形以改善其与最初经编码音频信息的对应频谱值的匹配。
120、根据根据本发明第二方面的其他实施例,音频解码器被配置为取决于包括于音频信息的经编码表示中的符号(sign)信息(例如符号值,例如ssf)而确定应用于与另一频率相关联的噪声值(例如,c(i-p'sf)f)或应用于与另一频率相关联的填充值的权重(例如gsf=(-1)ssf*(3+2*gsf)/8或1/2*gsf)。
121、发明人认识到,例如,使用符号信息,例如1位信息,可例如改善权重确定。作为实例,符号信息可允许(例如最终)填充值相对于其可基于的与另一频率相关联的噪声值和/或填充值的相位关系的调适。
122、根据根据本发明第二方面的其他实施例,音频解码器被配置为在系数c(i-p'sf)是使用噪声填充获得的情况下(例如在频谱位置i-p'sf处的系数c(i-p'sf)在先前处理中被标记为噪声填充零量化频谱系数的情况下)根据确定给定填充值且在系数c(i-p'sf)不是使用噪声填充获得的情况下(例如在频谱位置i-p'sf处的系数c(i-p'sf)在先前处理中未被标记为噪声填充零量化频谱系数的情况下)根据确定给定填充值c(i)表示使用噪声填充获得且具有频谱索引i的频谱系数,d表示衰减系数,g'sf表示基于包括于经编码音频表示中的增益值的权重;且c(i-p'sf)表示具有频谱索引i-p'sf的频谱系数(其可例如使用噪声获得,或其可例如在不使用噪声填充的情况下获得,且其可例如使用预测或滤波获得),其中p'sf为基于包括于经编码音频表示中的预测参数信息的预测参数或滤波参数。
123、发明人认识到,使用上述等式,可确定有效填充值。
124、根据根据本发明第二方面的其他实施例,音频解码器被配置为根据p'sf=psf+b获得预测参数或滤波参数p'sf,其中psf为包括于经编码音频表示中的滞后索引,且其中b为常数,其中b可例如等于用以编码psf的位的数目,其中psf可例如采用0与2b-1之间的值。另外或替代地,音频解码器被配置为根据g'sf=(-1)ssf*(3+2*gsf)/8获得权重g'sf,其中ssf为例如以经编码形式包括于经编码表示中的二进制值,且其中gsf为例如以经编码形式包括于经编码表示中的二进制值。替代地或另外,音频解码器被配置为根据d=(7.5-gsf)/8获得衰减系数d,其中gsf为例如以经编码形式包括于经编码表示中的二进制值。
125、作为实例,可根据给定帧是否具有多于一个子帧来选择常数b。发明人认识到,使用上述等式,可实现解码的发信号表示工作量、复杂性和有效性之间的良好权衡。
126、根据根据本发明第二方面的其他实施例,音频解码器被配置为标记噪声填充零量化频谱系数,且音频解码器被配置为选择性地使用应用于未标记为噪声填充零量化频谱系数的频谱系数的减小的滤波强度,例如1/2*g'sf。
127、发明人认识到,用于未标记频谱系数的滤波强度的减小可例如改善音频信息的原始频谱的重构或近似得出。
128、根据根据本发明第二方面的其他实施例,音频解码器被配置为取决于预测滞后信息和/或取决于音频信息的调性而在第二频谱填充方法(例如,“噪声填充”,其中随机或伪随机填充值用以填充频谱孔,例如不使用频率滤波且不使用频率预测以便获得填充值)与第三频谱填充方法(例如“间隙填充”,其中使用非零频谱系数的复制获得的填充值用以填充频谱孔)之间切换。任选地,可例如取决于调性信息的存在和/或取决于调性信息和/或取决于hpf数据而判断调性。作为另一任选特征,第二频谱填充方法和第三频谱填充方法为例如“一个或多个其他频谱填充方法”。
129、发明人认识到,音频信息的解码可例如通过在随机或伪随机填充值的使用与非零频谱的复制之间例如在频率距离内(例如在通过预测滞后信息确定的频率距离内)切换来改善。此外,发明人认识到,这种切换可基于预测滞后信息和/或取决于音频信息的调性来执行。
130、作为实例,将音频信息或例如子帧sf分类为“音调”可基于先前技术音频调性数据来执行,例如通过在音频调性数据存在的情况下(例如,td-ltp/hpf数据为非零)将sf分类为“音调的”。或者,作为另一实例,sf可仅在传输td-ltp/hpf增益值且其为最大值的情况下才被分类为“音调的”。
131、根据根据本发明第二方面的其他实施例,音频解码器被配置为基于经编码音频信息获得调性信息,例如,定量地描述经编码音频信息的音频内容的调性的调性值,或例如指示经编码音频信息的音频内容是否为音调的的调性旗标,以例如从位串流获得逐帧或逐子帧(例如,逐音频帧或逐音频子帧)的时间(音频调性)音调信息jsf。此外,音频解码器被配置为取决于或依赖于调性信息而在第二频谱填充方法(例如,“噪声填充”,例如基于随机或伪随机噪声值的噪声填充)与第三频谱填充方法(例如,“间隙填充”)之间切换。
132、发明人认识到,若解码器被配置为从或基于经编码音频信息获得调性信息,则可改善发信号表示工作量。
133、根据根据本发明第二方面的其他实施例,音频解码器被配置为例如从位串流或从经编码音频信息获得预测滞后信息,例如频域长期预测滞后值psf,例如频谱(ltp,例如长期预测)距离值psf。
134、根据根据本发明第二方面的其他实施例,音频解码器被配置为取决于包括于经编码音频表示中且可由音频解码器从经编码音频信息提取的调性信息和/或取决于指示调性信息是否包括于经编码音频信息中的信息(例如旗标)和/或取决于滤波增益值和/或取决于预测增益值(例如td-ltp增益值)和/或取决于时域后置滤波器增益值(hpf增益值,例如谐波后置滤波器增益值)而判断(例如确定或决定)音频信息是否为音调的。
135、如上所解释,根据本发明的实施例不限于音频信息的调性特性的特定评估。因此,本发明的解码器可包括用于检查调性信息的良好灵活性。
136、根据根据本发明第二方面的其他实施例,音频解码器被配置为针对低于(例如较高)噪声填充结束频率的较高频区中的频谱孔的填充应用高频噪声增益调整。
137、作为实例,使用高频噪声增益调整,用于填充频谱孔的填充值的频谱能量可经调整以允许(例如原始)音频输入频谱的较佳重构。
138、根据根据本发明第二方面的其他实施例,音频解码器被配置为例如使用包括于经编码音频信息中的经编码高频能量信息值的解码,基于经编码音频信息获得高频能量信息,例如高频能量差量值。
139、作为实例,高频能量信息(例如hf能量值(或例如,在差分熵编码的情况下的差量))可表示例如稍微低于噪声填充结束频率(例如,在8khz至10khz频率范围内)的音频信息的以频谱时间方式归一化的频谱系数(经量化为零)的原始能量,例如原始rms能量。举例而言,高频能量信息可经量化,如aac中的缩放因子,例如在1.51db的步长中以对数方式量化。
140、使用高频能量信息,可有效地解码和/或重构音频信息。任选地,增益调整可基于高频能量信息而执行。
141、根据根据本发明第二方面的其他实施例,音频解码器被配置为取决于高频能量值(例如ehfsf,其可例如以经编码形式包括于经编码音频表示中)、取决于全局增益值(例如ggsf,其可例如以经编码形式包括于经编码音频表示中)且取决于(例如宽带)噪声水平信息(其可例如与宽于与高频能量值所相关联的频率区的频率区相关联,例如lsf,其可例如以经编码形式包括于经编码音频表示中)而获得高频能量差量值(例如nrfacsf)。此外,音频解码器被配置为应用高频能量差量值来获得一个或多个噪声填充值。
142、作为实例,为了将传达关于高频能量值的信息至解码器所需的发信号表示开销降至最低,可将关于能量值的信息作为相对于全局增益值(例如核心编码器的全局增益)和噪声水平信息(例如噪声水平)乘积的差量值进行传输,例如作为“噪声增益归一化”值,例如ggsf*lsf。这可例如通过传输高频能量值与全局增益值和噪声水平信息的乘积之间的比率的对数的经舍入缩放结果来实现。
143、发明人认识到,基于增益值与噪声水平信息的乘积,可获得hf能量值,其允许获得可提供(例如原始)输入音频频谱的良好重构的用于填充频谱孔的噪声填充值。
144、根据根据本发明第二方面的其他实施例,音频解码器被配置为将与低于(例如较高)噪声填充结束频率的较高频区中的频率相关联的一个或多个中间噪声填充值选择性地与高频能量差量值相乘,例如,而使低于该较高频区的较低频率区中的噪声值不受该高频能量差量值影响。
145、使用这种方法,较高频区中的噪声强度可例如基于可在位串流中编码的高频能量差量值加以调整。以这种方式,可例如改善听觉印象。
146、根据根据本发明第二方面的其他实施例,音频解码器被配置为将高频噪声增益调整选择性地应用于执行噪声填充所针对的频谱值,而例如使不执行噪声填充的频谱值不受影响。
147、发明人认识到,在计算工作量与最佳化工作量之间的良好折衷可通过例如仅对被执行噪声填充的频谱值进行增益调整来实现。
148、根据根据本发明第二方面的其他实施例,音频解码器被配置为例如基于单一共同高频能量值或基于单一共同高频能量差量值而在8khz与10khz之间的频率范围中(例如选择性地)应用高频噪声增益调整。
149、发明人认识到,在上述频率范围内应用高频噪声增益调整可提供额外复杂度与经解码音频信息的质量之间的良好折衷。
150、根据根据本发明第二方面的其他实施例,高频能量值或高频能量差量值表示频率低于且例如邻近于噪声填充结束频率或在低于且例如邻近于噪声填充结束频率的频率区中的多个(例如以频谱时间方式归一化的)频谱系数(量化为零)的(例如原始(例如rms))能量。
151、因此,较高频区中的噪声可经调整为接近于((例如原始)例如真实)强度。
152、根据本发明第二方面的其他实施例包括一种用于基于输入音频信息提供经编码音频信息的音频编码器,其中音频编码器被配置为编码多个经量化频谱值,且其中音频编码器被配置为获得(例如确定)滞后值,例如fd-ltp滞后,例如滞后值psf,其定义待由音频解码器执行以导出用于填充频谱孔的一个或多个填充值的滤波操作(例如在频率方向上)或预测操作(例如在频率方向上)的特性。此外,音频编码器被配置为获得(例如确定)增益值(例如gsf),该增益值定义待由音频解码器执行以导出用于填充频谱孔的一个或多个填充值的滤波操作或预测操作的特性。此外,若增益值(例如gsf)小于阈值(例如β)或若增益值的绝对值小于阈值,则音频编码器被配置为(例如选择性地)设定或例如改变滞后值为零,从而获得经修改的滞后值(例如psf=0);且音频编码器被配置为编码所确定的滞后值或经修改的滞后值,其中例如,若增益值被修改,例如使用3或4个位来编码经修改滞后值。
153、举例而言,如前所解释,可基于预测滞后信息执行经解码频谱值集合的频谱孔的解码器侧填充。预测滞后信息可对应于,例如可为或可包括,滞后值或经修改滞后值,或可使用该滞后值或经修改滞后值确定。因此,基于这样的滞后信息,音频信息的解码和/或重构可例如有效地执行。
154、发明人认识到,滞后值可根据增益值来确定,该增益值与待由音频解码器执行以导出用于填充频谱孔的一个或多个填充值的滤波操作或预测操作相关联。简言之,且作为实例,若增益值不显著,则滞后值可设定为零。这种调适可得到经修改滞后值。
155、举例而言,在增益值低或不显著的情况下,在来自不同频带的频谱系数之间可能仅存在弱关系,因此可对应于这些值之间在频率方向上的相关性的滞后信息可能不可利用,或例如因为逐增益低影响相关性而可能不适用于频谱值重构。因此,通过在增益过小的情况下将滞后值设定为零,可节省比特率。
156、根据根据本发明第二方面的其他实施例,音频编码器被配置为使用应用于例如处于滞后b<p'<b+2b处的一组频谱值(例如应用于以频谱时间方式归一化的频谱)的自相关信息确定滞后值和增益值,其中例如,滞后值(例如psf)是取决于基于该组频谱值获得的自相关函数的峰值的位置而确定。
157、作为实例,自相关信息可为归一化的自相关信息。一般而言,滞后值(或经修改滞后值)、用于频谱系数的滤波和/或预测的增益值和/或符号索引或对应索引可例如在例如变换系数量化之前利用的以频谱时间方式归一化的域中计算。
158、根据根据本发明第二方面的其他实施例,若经编码的滞后值(例如滞后值或经修正滞后值)为非零,则音频编码器被配置为选择性地编码增益值。
159、作为实例,反之亦然,如前所解释,若增益值显著,且滞后值为非零,则可执行频谱系数(例如噪声填充或间隙填充频谱值)的预测或滤波,因此,作为实例,仅在这样的情况下,才可提供用于增益值和滞后值的发信号表示位。
160、根据根据本发明第二方面的其他实施例,音频编码器被配置为在经编码滞后值为零的情况下选择性地编码高频能量值,该高频能量值描述例如输入音频信息或其经预处理版本的频谱的上部部分中的能量。
161、作为实例,在由于不利增益和/或滞后值而可能不执行对频谱系数的滤波或预测的情况下,可提供高频能量值,例如以便以对应频谱能量执行噪声填充或间隙填充。
162、根据根据本发明第二方面的其他实施例,音频编码器被配置为取决于经编码滞后值选择性地编码增益值或高频能量值,其描述频谱(例如输入音频信息或其经预处理版本)的上部部分中的能量。
163、作为实例,通过使用增益值或高频能量值的选择性编码,可减少发信号表示工作量。
164、根据根据本发明第二方面的其他实施例,音频编码器被配置为使用相同数目个位编码增益值和高频能量值,其中例如,增益值是使用一个位用于符号且一个位用于量值而编码,且其中例如,高频能量值是使用2个位编码。
165、发明人认识到,使用相同数目个位来编码增益值和高频能量值可提供可互换编码,使得可关于滞后值采取编码内容的决策,而不必调适待编码的位的数目。
166、根据根据本发明第二方面的其他实施例,音频编码器被配置为针对不同音频帧和/或针对不同音频子帧确定单独滞后值和/或单独增益值。
167、发明人认识到,逐帧和/或逐子帧滞后值和/或增益值可改善音频信息的编码。
168、根据根据本发明第二方面的其他实施例,音频编码器被配置为例如使用一组频谱值(例如使用在频率方向上对该组频谱值中的周期性的分析)在变换域中获得滞后值和/或增益值。
169、发明人认识到,可以计算上有效的方式执行所述信息的确定或获得。
170、根据根据本发明第二方面的其他实施例,音频编码器被配置为执行长期瞬态性检测,且在发现例如音频帧或音频子帧(由sf指定)不为长期瞬态的情况下将滞后值选择性地设定为零。
171、由于滞后值可例如为用于帧或子帧的瞬态性的指示符,因此在未检测到瞬态性的情况下,该值可设定为零。因此,在未检测到帧或子帧的瞬态性的情况下,编码器可进一步基于瞬态性检测而暂时中止解码器中对零量化频谱值的滤波或预测。
172、根据本发明的其他实施例包括一种用于基于输入音频信息提供经编码音频信息的音频编码器,其中音频编码器被配置为编码多个经量化频谱值,且其中音频编码器被配置为编码高频能量值或高频能量差量值。此外,高频能量值或高频能量差量值表示频率低于且例如邻近于噪声填充结束频率或在低于且例如邻近于噪声填充结束频率的频率区中的多个(例如以频谱时间方式归一化的)频谱系数(量化为零)的(例如原始(例如rms))能量。
173、如前所解释,高频能量值(或例如在差分熵编码的情况下的差量)可表示稍微低于噪声填充结束频率(例如在8khz至10khz频率范围内)的以频谱时间方式归一化的频谱系数(经量化为零)的原始能量,例如原始rms能量。
174、为了最小化发信号表示开销以将高频能量值传达至解码器,能量值可作为例如相对于全局增益和噪声水平乘积的差量传输,例如作为“噪声增益归一化的”值传输。这可例如通过传输高频能量值与全局增益和噪声水平的乘积之间的比率的对数的经舍入缩放结果来实现。
175、作为实例,基于高频能量值或高频能量差量值,在解码器中,可例如使用间隙填充来重构零量化频谱系数,使得所述零量化系数(例如,原始音频信号)的能量至少得以近似得出。
176、根据根据本发明第二方面的其他实施例,音频编码器被配置为以对数方式量化高频能量值或高频能量差量值。
177、发明人认识到,可以计算上有效的方式执行对数方式量化。
178、根据根据本发明第二方面的其他实施例,音频编码器被配置为编码相对于由音频编码器编码的全局增益与由音频编码器编码的噪声水平的乘积的高频能量差量值,其描述频率低于且例如邻近于噪声填充结束频率或在低于且例如邻近于噪声填充结束频率的频率区中的多个(例如以频谱时间方式归一化的)频谱系数(经量化为零)的能量。
179、发明人认识到,高频能量差量值的编码可例如最小化发信号表示开销。
180、根据根据本发明第二方面的其他实施例,音频编码器被配置为获得高频能量值与全局增益和噪声信息的乘积之间的比率的对数的经舍入缩放结果,以便编码高频能量值,例如以高频能量差量值的形式。
181、发明人意识到,可以计算上有效的方式获得经舍入缩放结果。
182、根据根据本发明第二方面的其他实施例,音频编码器被配置为根据ehfsf=1+round(δ*log2(ehfsf/(ggsf*lsf))确定经量化高频能量差量值,其中ehf为高频能量值,例如例如经量化为零的频谱值的hf原始rms能量,其中ggsf为全局增益,其中lsf为噪声水平,且其中δ为常数。
183、发明人认识到,上式的使用可允许对经量化高频能量差量值的有效确定。
184、根据本发明的其他实施例包括一种用于基于经编码音频信息提供经解码音频信息的方法,该方法包括:例如使用基于相应填充值量化为零的频谱系数的取代来填充经解码频谱值集合的频谱孔;和例如从位串流或从经编码音频信息获得预测滞后信息,例如频域长期预测滞后值psf,例如指示频率方向上的预测周期的预测滞后信息,例如频谱(ltp,例如长期预测)距离值psf。此外,该方法包括取决于预测滞后信息而在第一频谱填充方法(例如“噪声填充”+fd ltp)与一个或多个其他频谱填充方法(例如第二频谱填充方法或第三频谱填充方法,例如“间隙填充”)之间切换,在该第一频谱填充方法中,使用频率滤波或频率预测(例如tns或ltp,例如其中与第一频率相关联的频谱值对与第二频率相关联的频谱值具有影响的滤波)来获得用以填充频谱孔的填充值,且在该一个或多个其他频谱填充方法中,不使用频率滤波且不使用频率预测来获得用以填充频谱孔的填充值。
185、根据本发明的其他实施例包括一种用于基于输入音频信息提供经编码音频信息的方法,该方法包括:编码多个经量化频谱值;和获得(例如确定)滞后值(例如fd-ltp滞后,例如滞后值psf),其定义待由音频解码器执行以用于导出用于填充频谱孔的一个或多个填充值的滤波操作(例如在频率方向上)或预测操作(例如在频率方向上)的特性。该方法进一步包括:获得(例如确定)增益值(例如gsf),其定义待由音频解码器执行以用于导出用于填充频谱孔的一个或多个填充值的滤波操作或预测操作的特性;和在该增益值(例如gsf)小于阈值(例如β)的情况下或在该增益值的绝对值小于阈值的情况下将该滞后值(例如选择地)设定或例如改变为零,从而获得经修改滞后值(例如psf=0)。此外,该方法包括编码所确定的滞后值或经修饰滞后值,其中例如若增益值被修改,则例如使用3或4个位来编码经修改滞后值。
186、根据本发明的其他实施例包括一种计算机程序,其用于当该计算机程序在计算机上运行时执行以上所解释的方法中的任一者。
187、根据本发明的其他实施例,音频解码器被配置为执行与给定频率相关联的噪声值和与另一频率相关联的频谱值(例如,噪声值或填充值,或经处理或未经处理的经编码值)的加权组合,或与给定频率相关联的填充值和与另一频率相关联的频谱值(例如,噪声值或填充值,或经处理或未经处理的经编码值)的加权组合,以便获得给定填充值。此外,音频解码器被配置为取决于是否已针对与另一频率相关联的频谱值应用噪声填充而调整给定至与另一频率相关联的频谱值的权重。
188、其他实施例包括一种用于基于经编码音频信息提供经解码音频信息的音频解码器,其中音频解码器被配置为填充经解码频谱值集合的频谱孔。此外,音频解码器被配置为:获得预测增益信息;和取决于预测增益信息而在第一频谱填充方法与一个或多个其他频谱填充方法之间切换,在该第一频谱填充方法中,使用频率滤波或频率预测来获得用以填充频谱孔的填充值,且在该一个或多个其他频谱填充方法中,不使用频率滤波且不使用频率预测来获得用以填充频谱孔的填充值。
189、根据本发明的其他实施例包括一种用于基于输入音频信息提供经编码音频信息的音频编码器,其中音频编码器被配置为编码多个经量化频谱值。此外,音频编码器被配置为获得增益值,该增益值定义待由音频解码器执行以用于导出用于填充频谱孔的一个或多个填充值的滤波操作或预测操作的特性。此外,音频编码器被配置为编码增益值,且若经量化增益值或经编码增益值为非零,则选择性地编码滞后值,该滞后值定义待由音频解码器执行以用于导出用于填充频谱孔的一个或多个填充值的该滤波操作或该预测操作的特性。替代地或另外,音频编码器被配置为在该增益值大于或等于阈值的情况下,选择性地编码滞后值,该滞后值定义待由音频解码器执行以用于导出用于填充频谱孔的一个或多个填充值的滤波操作或预测操作的特性。
190、根据本发明的其他实施例包括一种用于基于经编码音频信息提供经解码音频信息的方法,该方法包括:填充经解码频谱值集合的频谱孔;获得预测增益信息;和取决于该预测增益信息而在第一频谱填充方法与一个或多个其他频谱填充方法之间切换,在该第一频谱填充方法中,使用频率滤波或频率预测来获得用以填充频谱孔的填充值,且在该一个或多个其他频谱填充方法中,不使用频率滤波且不使用频率预测来获得用以填充频谱孔的填充值。
191、根据本发明的其他实施例包括一种用于基于输入音频信息提供经编码音频信息的方法,该方法包括:编码多个经量化频谱值;获得增益值,该增益值定义待由音频解码器执行以用于导出用于填充频谱孔的一个或多个填充值的滤波操作或预测操作的特性;编码增益值;若经量化增益值或经编码增益值为非零,则选择性地编码滞后值,该滞后值定义待由音频解码器执行以用于导出用于填充频谱孔的一个或多个填充值的滤波操作或预测操作的特性;或若该增益值大于或等于阈值,则选择性地编码滞后值,该滞后值定义待由音频解码器执行以用于导出用于填充频谱孔的一个或多个填充值的滤波操作或预测操作的特性。
192、方面3
193、根据本发明第三方面的其他实施例包括一种用于基于经编码音频表示提供经解码音频表示的音频解码器,其中音频解码器被配置为使用相应填充值填充经解码频谱值集合的频谱孔(例如使用基于相应填充值量化为零的频谱系数的取代)。此外,音频解码器被配置为使用预测或滤波(例如使用计算规则d*c(i)+g'sf*c(i-p'sf))确定(例如最终)填充值(例如用于c(i)的替代,例如),使得与给定频率(例如与给定频率区间)相关联的给定填充值(例如)是取决于与不同频率(例如,与不同频率区间,例如与具有频率区间索引i-p'sf的不同频率区间,例如与给定频率或与给定频率区间相距频谱距离p'sf或频谱距离dsf的频率或频率区间)相关联的另一频谱值(例如c(i-p'sf)或)而获得。
194、此外,音频解码器被配置为取决于与不同频率(例如,与不同频率区间;例如与具有频率区间索引i-p'sf的不同频率区间)相关联的经编码或经量化频谱值(例如,如(最初)由经编码音频信息中的各个频谱值的经编码表示确定,例如由在应用噪声填充之前的频谱值确定,例如由直接在算术解码之后的频谱值确定的频谱值)而调适滤波强度(例如,与不同频率相关联的频谱值的加权,例如通过将滤波强度选择性地设定为g'sf或1/2g'sf)。
195、发明人认识到,可使用预测或滤波基于与不同频率相关联的其他频谱值来确定或计算或获得填充值。简单来说,且作为实例,可利用例如不同频率(例如不同频带)的频谱值的频谱系数的相关性或依赖性。
196、因此,可例如通过利用这样的相关性而减少编码工作量和/或可改善听觉印象。因此,使用预测系数和/或滤波系数,填充值可通过需要被传输的减少的位量确定,同时仍提供最初经编码音频信号的良好表示。
197、此外,发明人认识到,经编码音频表示的解码可例如通过取决于与不同频率相关联的经编码或经量化频谱值而调适滤波强度来改善。
198、如前所解释,与给定频率相关联的填充值可例如,在预测滞后信息为非零且因此(作为实例)指示信号的瞬态性的情况下,可基于或使用与不同频率相关联的频谱值来确定或获得或计算。
199、作为实例,在选择第一频谱填充方法的情况下,例如在选择具有fd-ltp的噪声填充的情况下(例如,若预测滞后信息为非零,作为实例,若fd-ltp滞后为非零),在解码器侧噪声填充例程期间(例如,取决于“当前”经编码fd系数是否为零且取决于位于与当前系数相距一定距离(由经传输预测滞后信息指定,例如由所传输fd-ltp滞后指定)处的对应“先前”经编码fd系数是否为零)可执行在音频变换编码解码器的频谱域(例如mdct域)中应用长期预测性滤波器。作为实例,无限脉冲响应(iir)ltp类滤波器可用于滤波。
200、举例而言,若与不同频率相关联的频谱值相对大,例如非零,则滤波强度可减小。因此,与不同频率相关联的大频谱值的影响可通过选择性地调适滤波强度而减小。因此,可避免填充值或噪声值采用过大的值。
201、根据根据本发明第三方面的其他实施例,滤波强度确定例如c(i-p'sf)的另一频谱值对给定填充值的影响。
202、因此,作为实例,滤波强度可表示另一频谱值的加权因子。发明人认识到,这样的影响的调适性或作为实例,另一频谱值的加权,可改善经解码音频信息。
203、根据根据本发明第三方面的其他实施例,音频解码器被配置为取决于与不同频率相关联的频谱值(该频谱值例如最初是由经编码音频信息中的各个频谱值的经编码表示确定)而调适滤波强度。
204、发明人认识到,使用由用于调适滤波强度的经编码表示表示的值允许使用或利用由经编码表示而非其经滤波版本(其可例如经交替)提供的信息。已发现,使用这样的准则,相比于使用取决于在解码器侧上已经预处理的值的准则,对于滤波强度的选择更可靠。
205、根据根据本发明第三方面的其他实施例,音频解码器被配置为取决于在应用噪声填充之前的与不同频率相关联的频谱值来调适滤波强度。
206、发明人认识到,在噪声填充之前使用与不同频率相关联的频谱值可允许基于频谱值是否经量化为零的信息来调适滤波强度。
207、根据根据本发明第三方面的其他实施例,音频解码器被配置为取决于与不同频率(或值)相关联的频谱值是否量化为零来调适滤波强度。
208、发明人认识到,例如,相较于未经量化为零的频谱值,不同滤波强度可应用于经量化为零的频谱值。这可改善经重构频谱的准确度。
209、根据根据本发明第三方面的其他实施例,音频解码器被配置为取决于是否将噪声填充应用于与不同频率(或值)相关联的频谱值来调适滤波强度。
210、发明人认识到,使用这种准则,例如,除了基于针对频谱值的相应频率是否试图执行或已执行噪声填充以外,可还基于是否已将相应频谱值量化为零的信息,来执行滤波强度调适。这可包括使用旗标。
211、根据根据本发明第三方面的其他实施例,音频解码器被配置为对于针对其应用噪声填充的频谱值(例如针对在位置i>=p'sf处的每一噪声填充零量化频谱系数c)选择性地应用频率方向上的滤波或频率方向上的预测。
212、如前所解释,发明人认识到,作为实例,可基于或使用频率方向上的滤波或预测来近似得出或估计零量化频谱值。因此,可例如利用不同频谱值中的频谱值在频率方向上的依赖性。
213、根据根据本发明第三方面的其他实施例,音频解码器被配置为应用预测或滤波,以便基于随机或伪随机噪声值(例如c(i))确定给定(例如最终)填充值(例如)。
214、如前所解释,发明人认识到,随机或伪随机噪声值可例如使用预测或滤波来调适,以便计算可提供用于音频信息的(例如原始)例如输入频谱的零量化频谱值的良好近似的(例如最终)填充值。
215、根据根据本发明第三方面的其他实施例,音频解码器可被配置为执行与给定频率相关联的噪声值和与另一频率相关联的噪声值的加权组合(例如,组合d*c(i)+g'sf*c(i-p'sf),其中噪声值c(i)的权重d与给定频率相关联,且噪声值的权重g'sf与另一频率相关联,或执行组合d*c(i)+1/2*g'sf*c(i-p'sf),其中噪声值c(i)的权重d与给定频率相关联,且噪声值的权重1/2*g'sf与另一频率相关联),或与给定频率相关联的噪声值和与另一频率相关联的填充值的加权组合,以便获得给定(例如最终)填充值,例如此外,音频解码器被配置为取决于噪声填充是否已应用于与另一频率相关联的频谱值来调整给定至与另一频率相关联的噪声值的权重(例如g'sf或1/2*g'sf)或给定至与另一频率相关联的填充值的权重(例如g'sf或1/2*g'sf)。
216、如上所解释,发明人认识到,(例如最终)填充值可例如使用例如与给定频率相关联或与另一频率相关联的噪声值和/或与另一频率相关联的填充值的不同频率依赖性量来计算。因此,本发明概念可允许确定或获得或计算具有良好灵活性的(例如最终)填充值,使得根据特定情形,可获得可良好或甚至最佳地适合于(例如原始)音频信息频谱的重构的填充值。举例而言,可基于预测滞后信息执行待用于获得(例如最终)填充值的相应量的选择。此外,发明人认识到,与另一频率相关联的对应噪声值或填充值的相应权重的调适或调整可改善(例如最终)填充值的确定,且因此改善音频信息的重构。
217、根据根据本发明第三方面的其他实施例,音频解码器被配置为基于描述包括于音频信息的经编码表示中的频谱距离的经编码信息(例如经编码值)确定与给定频率相关联的填充值和与不同频率相关联的另一频谱值之间的频谱距离,例如p'sf。
218、基于该频谱距离,解码器可例如决定是否将预测或滤波用于填充值的确定。该距离可与前文所解释的预测滞后信息和/或预测滞后值相关联。此外,可基于该距离确定或设定或获得对应预测或滤波的参数,例如滤波阶数。发明人认识到,可使用频谱距离以便改善对频谱填充值的确定。
219、根据根据本发明第三方面的其他实施例,音频解码器被配置为基于包括于音频信息的经编码表示中的增益信息(例如,增益值,例如,gsf)确定应用于与给定频率相关联的噪声值的权重(例如,d),其中作为实例,应用于与给定频率相关联的噪声值的该权重为正值,例如在0.5与1之间的范围内。
220、如前所解释,发明人认识到,例如,与给定频率相关联的相应噪声值可用取决于增益信息确定的权重加以调适。这可允许对该噪声值进行塑形以改善其与最初经编码音频信息的对应频谱值的匹配。
221、根据根据本发明第三方面的其他实施例,音频解码器被配置为取决于包括于音频信息的经编码表示中的增益信息(例如增益值,例如gsf)确定应用于与另一频率相关联的噪声值(例如c(i-p'sf))或应用于与另一频率相关联的填充值的权重(例如,gsf=(-1)ssf*(3+2*gsf)/8,或1/2*gsf),其中应用于与给定频率相关联的噪声值的权重例如为正或负值,例如具有在0.25与0.75之间的绝对值。
222、如前所解释,发明人认识到,例如,相应噪声值或与另一频率相关联的相应填充值可用取决于增益信息确定的权重加以调适。这可允许对该噪声或填充值进行塑形以改善其与最初经编码音频信息的对应频谱值的匹配。
223、根据根据本发明第三方面的其他实施例,音频解码器被配置为取决于包括于音频信息的经编码表示中的符号信息(例如符号值,例如ssf)来确定应用于与另一频率相关联的噪声值(例如,c(i-p'sf))或与另一频率相关联的填充值的权重,例如gsf=(-1)ssf*(3+2*gsf)/8或1/2*gsf。
224、如前所解释,发明人认识到,例如,使用符号信息,例如1位信息,可例如改善权重确定。作为实例,符号信息可允许(例如最终)填充值相对于其可基于的与另一频率相关联的噪声值和/或填充值的相位关系的调适。
225、根据根据本发明第三方面的其他实施例,音频解码器被配置为在系数c(i-p'sf)是使用噪声填充获得的情况下(例如在频谱位置i-p'sf处的系数c(i-p'sf)在先前处理中被标记为噪声填充零量化频谱系数的情况下)根据确定给定填充值且在系数c(i-p'sf)不是使用噪声填充获得的情况下(例如在频谱位置i-p'sf处的系数c(i-p'sf)在先前处理中未被标记为噪声填充零量化频谱系数的情况下)根据确定给定填充值c(i)表示使用噪声填充获得且具有频谱索引i的频谱系数,d表示衰减系数,g'sf表示基于包括于经编码音频表示中的增益值的权重;c(i-p'sf)表示可例如使用噪声获得或可例如在不使用噪声填充的情况下获得,且可例如使用预测或滤波获得的具有频谱索引i-p'sf的频谱系数,其中p'sf为基于包括于经编码音频表示中的预测参数信息的预测参数或滤波参数。
226、发明人认识到,使用上述等式,可确定有效填充值。
227、根据根据本发明第三方面的其他实施例,音频解码器被配置为根据p'sf=psf+b获得预测参数或滤波参数p'sf,其中psf为包括于经编码音频表示中的滞后索引,且其中b为常数,其中b可例如等于用以编码psf的位的数目,其中psf可例如采用0与2b-1之间的值。替代地或另外地,音频解码器被配置为根据g'sf=(-1)ssf*(3+2*gsf)/8获得权重g'sf,其中ssf为例如以经编码形式包括于经编码表示中的二进制值,且其中gsf为例如以经编码形式包括于经编码表示中的二进制值。替代地或另外地,音频解码器被配置为根据d=(7.5-gsf)/8获得衰减系数d,其中gsf为例如以经编码形式包括于经编码表示中的二进制值。
228、作为实例,可根据给定帧是否具有多于一个子帧来选择常数b。发明人认识到,使用上述等式,可实现解码的发信号表示工作量、复杂性和有效性之间的良好权衡。
229、根据根据本发明第三方面的其他实施例,音频解码器被配置为标记噪声填充零量化频谱系数,且音频解码器被配置为选择性地使用应用于未标记为噪声填充零量化频谱系数的频谱系数的减小的滤波强度,例如1/2*g'sf。
230、发明人认识到,用于未标记频谱系数的滤波强度的减小可例如改善音频信息的原始频谱的重构或近似得出。
231、根据根据本发明第三方面的其他实施例,音频解码器被配置为针对多个子帧(sf)执行以下处理:
232、1.设定p'sf=psf+b,g'sf=(-1)ssf*(3+2*gsf)/8且d=(7.5-gsf)/8,其中,例如,psf>0;
233、2.例如使用lsf,例如使用用以取代为零的频谱系数的随机或伪随机噪声值来执行(例如常规)噪声填充,其中噪声强度可例如由噪声强度值isf确定,且标记例如所有或多个噪声填充零量化频谱系数;
234、3.对于例如按增大i排序的在位置i>=p'sf处的多个或甚至每一噪声填充零量化频谱系数c,进行:
235、4.若在步骤2中标记位置i-p'sf处的系数c,则用d*c(i)+g'sf*c(i-p'sf)替代c(i);否则
236、5.用d*c(i)+1/2*g'sf*c(i-p'sf)替代c(i)。
237、发明人认识到,使用上述步骤可实现解码的发信号表示工作量、复杂性和有效性之间的良好权衡。
238、根据本发明第三方面的其他实施例包括一种用于基于经编码音频表示提供经解码音频表示的音频解码器,其中音频解码器被配置为使用预测或滤波(例如使用时间噪声塑形(tns)和/或使用频域噪声塑形(fd-ltp))确定经处理频谱值(例如频谱系数),使得与给定频率(例如与给定频率区间)相关联的给定经处理频谱值是取决于另一频谱值(例如c(i-p'sf),或其与不同频率相关联,例如与不同频率区间相关联,例如与具有频率区间索引i-p'sf的不同频率区间相关联,例如与与给定频率或与给定频率区间相距频谱距离p'sf或频谱距离dsf的频率或频率区间相关联)而获得。
239、此外,音频解码器被配置为取决于与不同频率(例如,与不同频率区间;例如与具有频率区间索引i-p'sf的不同频率区间)相关联的经编码或经量化或经发信号表示的频谱值(例如,如(最初)由经编码音频信息中的各个频谱值的经编码表示确定,例如由应用噪声填充之前的频谱值确定,例如由直接在算术解码之后的频谱值确定的频谱值)来调适滤波强度(例如,与不同频率相关联的频谱值的加权,例如通过将滤波强度选择性地设定为g'sf或1/2g'sf)。
240、发明人认识到,经处理频谱值可例如使用预测或滤波基于与不同频率相关联的其他频谱值来确定或计算或获得。如前所解释,可利用例如不同频率(例如不同频带)的频谱值的频谱系数的相关性或依赖性,例如不仅用于填充值,而且用于经处理频谱值。
241、因此,可例如通过利用这样的相关性而减少编码工作量。因此,使用预测系数和/或滤波系数,可以需要传输的减少的位量确定频谱值,同时仍提供最初经编码音频信号的良好表示。
242、此外,发明人认识到,经编码音频表示的解码可通过取决于与不同频率相关联的经编码或经量化频谱值而调适滤波强度来改善。
243、根据根据本发明第三方面的其他实施例,例如,当相比于包括于预测或滤波中的零量化(和可能先前经处理,例如先前tns合成滤波)(例如,较低频率)频谱系数的贡献(例如,在预测或滤波中的加权)时)时,音频解码器被配置为调适滤波强度,以(例如选择性地)减少包括于预测或滤波中的非零量化且可能先前经处理(例如,先前tns合成滤波,例如的较低频率)频谱系数的贡献(例如,在预测或滤波中的加权)。
244、根据根据本发明第三方面的其他实施例,音频解码器被配置为在当前频谱系数(例如,由频谱索引i指定的当前频谱位置处的频谱系数c(i),例如在应用滤波之前在当前频谱位置处的频谱系数c(i),例如经传输当前频谱系数或经编码当前频谱系数或经量化当前频谱系数)为零(例如已量化为零)且先前频谱系数(例如频谱系数c(i-p'sf),例如表示为“另一频谱值”)例如在音频编码器侧处尚未编码为零或尚未量化为零的情况下,选择性地调适(例如减小)滤波强度(例如,时间噪声塑形滤波的,例如频域长期预测的,例如基于未经滤波当前频谱系数(例如c(i))与经滤波或未经滤波先前频谱系数(例如c(i-p'sf))的加权组合(例如d*c(i)+att*g'sf*c(i-p'sf),其中,例如,d为未经滤波当前频谱系数的权重,att为描述滤波强度的调适的衰减因子,g'sf为经滤波或未经滤波先前频谱系数的正常权重,且p'sf描述当前频谱系数与先前频谱系数之间的频谱距离)提供经滤波当前频谱系数的滤波的)。
245、根据根据本发明第三方面的其他实施例,音频解码器被配置为将滤波强度选择性地减小至0.25与0.75之间的值,或优选地减小至0.4与0.6之间的值,或优选地减小至0.5的值,以便调适滤波强度。
246、根据根据本发明第三方面的其他实施例,音频解码器被配置为在当前频谱系数(例如c(i))经编码或经量化为零的情况下,取决于多个(例如dsf个)先前(例如经编码或经量化或经发信号表示的)频谱系数(例如多个先前频谱系数)的值(例如经编码值或经量化值或经发信号表示的值)而例如通过使用共同按比例缩小因子(其考虑了多个(例如dsf个)先前频谱系数)按比例缩小滤波的滤波系数或预测系数(例如通过按比例缩小滤波系数或滤波系数,例如c(i-1)至c(i-dsf))来选择性地减小滤波强度。
247、根据根据本发明第三方面的其他实施例,音频解码器被配置为在当前频谱系数(例如c(i))经编码或经量化或经发信号表示为零的情况下且在滤波中考虑的所有先前频谱系数(例如c(i-1)至c(i-(dsf-1))(除了滤波中考虑的一个先前频谱系数,例如c(i-dsf),例如在滤波中考虑的与当前频谱系数相距最大频谱距离的频谱系数)经编码或经量化或经发信号表示为零的情况下,选择性地减小滤波强度(其中滤波强度可例如由多个滤波权重定义,其中在滤波强度减小的情况下,滤波权重可例如使用共同按比例缩小因子(可例如等于1/2)而例如选择性地按比例缩小),否则,使用未减小的滤波强度。
248、根据根据本发明第三方面的其他实施例,音频解码器被配置为使用滤波或预测取决于具有频谱索引i-dsf至i-1的多个(例如,经编码或经量化或经发信号表示或经滤波或经预测的)先前频谱系数(例如,c(i-1)至c(i-dsf))而获得具有频谱索引i的经滤波当前频谱系数(例如,c(i))。
249、此外,音频解码器被配置为在以下情况下选择性地减小滤波强度:在(例如在且仅在)具有频谱索引i-dsf+1至i的一个或多个(例如,经发信号表示的)频谱系数或所有频谱系数已经被量化或编码或发信号表示为零的情况下,且在具有频谱索引i-dsf的频谱系数尚未被量化或编码或发信号表示为零的情况下,其中例如dsf等于滤波阶数或预测阶数。
250、根据根据本发明第三方面的另外实施例,与具有介于i-dsf+1与i-1之间的频谱索引的频谱系数相关联的滤波器系数等于零。
251、根据根据本发明第三方面的其他实施例,音频解码器被配置为例如在噪声填充之前使用经编码或经量化或经发信号表示的频谱系数用于决定滤波强度。此外,音频解码器被配置为例如在应用噪声填充之后和/或在应用频域长期预测之后使用经预处理频谱系数作为用于滤波或预测的输入。
252、根据本发明第三方面的其他实施例包括一种用于基于经编码音频表示提供经解码音频表示的方法,该方法包括使用相应填充值填充经解码频谱值集合的频谱孔(例如使用基于相应填充值量化为零的频谱系数的取代)。该方法进一步包括使用预测或滤波(例如使用计算规则d*c(i)+g'sf*c(i-p'sf))确定(例如最终)填充值(例如用于c(i)的替代,例如),使得与给定频率(例如与给定频率区间)相关联的给定填充值(例如)是取决于与不同频率(例如,与不同频率区间,例如与具有频率区间索引i-p'sf的不同频率区间,例如与与给定频率或与给定频率区间相距频谱距离p'sf或频谱距离dsf的频率或频率区间)相关联的另一频谱值(例如c(i-p'sf)或)而获得。此外,该方法包括取决于与不同频率(例如,与不同频率区间;例如与具有频率区间索引i-p'sf的不同频率区间)相关联的经编码或经量化频谱值(例如,如(最初)由经编码音频信息中的各个频谱值的经编码表示确定,例如由在应用噪声填充之前的频谱值确定,例如由直接在算术解码之后的频谱值确定的频谱值)来调适滤波强度(例如,与不同频率相关联的频谱值的加权,例如通过将滤波强度选择性地设定为g'sf或1/2g'sf)。
253、根据本发明第三方面的其他实施例包括一种用于基于经编码音频表示提供经解码音频表示的方法,该方法包括使用预测或滤波确定经处理频谱值(例如频谱系数),使得与给定频率(例如与给定频率区间)相关联的给定经处理频谱值是取决于与不同频率(例如,与不同频率区间,例如与具有频率区间索引i-p'sf的不同频率区间,例如与与给定频率或与给定频率区间相距频谱距离p'sf或频谱距离dsf的频率或频率区间)相关联的另一频谱值(例如c(i-p'sf)或)而获得。此外,该方法包括取决于与不同频率(例如,与不同频率区间;例如与具有频率区间索引i-p'sf的不同频率区间)相关联的经编码或经量化频谱值(例如,如(最初)由经编码音频信息中的各个频谱值的经编码表示确定,例如由在应用噪声填充之前的频谱值确定,例如由直接在算术解码之后的频谱值确定的频谱值)来调适滤波强度(例如,与不同频率相关联的频谱值的加权,例如通过将滤波强度选择性地设定为g'sf或1/2g'sf)。
254、根据本发明第三方面的其他实施例包括一种计算机程序,其用于当该计算机程序在计算机上运行时执行以上方法中的任一者。
本文地址:https://www.jishuxx.com/zhuanli/20241106/323414.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。