用于解码声音或声场的高阶高保真度立体声响复制(HOA)表示的方法与流程
- 国知局
- 2024-06-21 11:31:55
本发明涉及用于针对hoa数据帧表示的压缩而确定表示与所述hoa数据帧中的特定数据帧的通道信号相关联的非差分增益值所需的最小整数比特数的设备。
背景技术:
1、表示为hoa的高阶高保真度立体声响复制提供了表示三维声音的一种可能性。其他技术是波场合成(wfs)或如22.2的基于通道的方法。与基于通道的方法相比,hoa表示提供了与特定扬声器设置无关的优点。然而,这种灵活性是以在特定扬声器设置上回放hoa表示所需要的解码过程为代价的。与所需扬声器的数量通常很大的wfs方法相比,hoa也可以被呈现为仅包括几个扬声器的设置。hoa的另一个优点是还可以采用相同的表示而不必对耳机的双耳渲染进行任何修改。
2、hoa基于通过截断的球面谐波函数(sh)展开来表示复合谐波平面波幅度的空间密度。每个展开系数是角频率的函数,角频率可以由时域函数等效地表示。因此,在不失一般性的情况下,完整的hoa声场表示实际上可以被假设成由o个时域函数组成,其中,o表示展开系数的数量。这些时域函数在下文中将被等效地称为hoa系数序列或hoa通道。
3、hoa表示的空间解析度随着展开的最大阶数n的增长而提高。遗憾的是,展开系数o的数量随着阶数n呈二次方增长,特别地,o=(n+1)2。例如,使用阶数n=4的典型hoa表示需要o=25个hoa(展开)系数。假设期望的单声道采样率为fs并且每个采样的比特数为nb,则用于传输hoa表示的总比特率由o·fs·nb确定。以采用每采样nb=16比特的fs=48khz采样率传输阶数为n=4的hoa表示,导致19.2 mbits/s的比特率,该比特率对于许多实际应用(例如流式传输)来说是非常高的。因此,对hoa表示进行压缩是非常可取的。
4、先前,在ep 2665208 a1、ep 2743922 a1、ep 2800401 al中提出了hoa声场表示的压缩,参见2014年1月的mpeg-h 3d音频的iso/iec jtc1/sc29/wg11、n14264、wd1-hoa文本。这些方法的共同点在于:它们都执行声场分析并且将给定的hoa表示分解成方向分量和残余环境分量。一方面,最终压缩的表示被假设成由若干量化信号组成,这些量化信号由方向信号和基于向量的信号的感知编码以及环境hoa分量的相关系数序列产生。另一方面,最终压缩的表示包括与量化信号相关的附加边信息,根据其压缩版本重构hoa表示需要所述边信息。
5、在被传递至感知编码器之前,要求这些中间时域信号具有在[-1,1]的值范围内的最大幅度,这是为实现当前可用的感知编码器而产生的要求。为了当对hoa表示进行压缩时满足该要求,在感知编码器之前使用平滑地衰减或放大输入信号的增益控制处理单元(参见ep 2824661 a1和上面提到的iso/iec jtc1/sc29/wg11 n14264文献)。所产生的信号修改被假设成是可逆的并且被逐帧地应用,其中特别地,连续帧之间的信号幅度的变化被假设成“2”的幂。为了便于该信号修改在hoa解压缩器中的倒置,相应的归一化边信息包括在总边信息中。该归一化边信息可以由底数为“2”的指数构成,这些指数描述了两个连续帧之间的相对幅度变化。由于连续帧之间的较小幅度变化比较大幅度变化更有可能发生,因此根据上面提到的iso/iec jtcl/sc29/wg11 n14264文献利用游程运行长度编码(runlength code)对这些指数进行编码。
技术实现思路
1、例如,在从开始至结束没有任何时间跳跃地对单个文件解压缩的情况下,在hoa解压缩中使用差分编码的幅度变化来重构原始信号幅度是可行的。然而,为了便于随机访问,独立的访问单元必须存在于编码表示(其通常是比特流)中以使得能够与来自在先帧的信息无关地从期望的位置(或至少在其附近)开始解压缩。这种独立的访问单元必须包含由增益控制处理单元引起的从第一帧一直到当前帧的总绝对幅度变化(即,非差分增益值)。假设两个连续帧之间的幅度变化是“2”的幂,则通过底数为“2”的指数来描述总绝对幅度变化就足够了。为了对该指数进行高效编码,在应用增益控制处理单元之前了解信号的可能的最大增益是必要的。然而,该知识高度依赖于对要压缩的hoa表示的值范围的约束规范。遗憾的是,mpeg-h 3d音频文献iso/iec jtc1/sc29/wg11 n14264仅提供用于输入hoa表示的格式的描述,而没有对值范围设定任何约束。
2、本发明要解决的问题是提供表示非差分增益值所需的最小整数比特数。该问题通过权利要求1中公开的设备来解决。在相应的从属权利要求中公开了本发明的有利的附加实施方式。
3、本发明确立了输入hoa表示的值范围与信号在hoa压缩器中应用增益控制处理单元之前的可能的最大增益之间的相互关系。
4、基于该相互关系,针对输入hoa表示的值范围的给定规范、针对底数为“2”的指数的有效编码来确定所需比特的量,以在访问单元内描述由增益控制处理单元引起的从第一帧一直到当前帧的修改信号的总绝对幅度变化(即,非差分增益值)。
5、此外,一旦计算用于对指数编码的所需比特量的规则被确定,本发明就使用用于验证给定hoa表示是否满足所需值范围约束的处理,使得给定hoa表示能够被正确压缩。
6、原则上,本发明的设备适合于针对hoa数据帧表示的压缩而确定用于表示所述hoa数据帧中的特定hoa数据帧的通道信号的非差分增益值所需的最小整数比特数βe,其中,每个帧中的每个通道信号包括一组采样值,并且其中,给所述hoa数据帧中的每个hoa数据帧的每个通道信号分配差分增益值,并且这样的差分增益值引起当前hoa数据帧中的通道信号的采样值的幅度相对于前一hoa数据帧中的通道信号的采样值变化,并且其中,这样的增益调整的通道信号在编码器中被编码,
7、并且其中,所述hoa数据帧表示在空间域中被渲染为o个虚拟扬声器信号wj(t),其中,虚拟扬声器的位置位于单位球体上并且旨在均匀分布在该单位球体上,所述渲染通过矩阵乘法w(t)=(ψ)-1·c(t)来表示,其中,w(t)是包含所有虚拟扬声器信号的向量,σ是虚拟扬声器位置模矩阵,并且c(t)是所述hoa数据帧表示的相应hoa系数序列的向量,
8、并且其中,所述hoa数据帧表示被归一化,使得
9、
10、所述设备包括:
11、-通过以下操作a)、b)、c)中的一个或更多个从所述归一化hoa数据帧表示中形成所述通道信号的装置:
12、a)为了表示所述通道信号中的主要声音信号,将所述hoa系数序列c(t)的向量乘以混合矩阵a,混合矩阵a的欧几里德范数不大于“1”,其中,混合矩阵a表示所述归一化hoa数据帧表示的系数序列的线性组合;
13、b)为了表示所述通道信号中的环境分量camb(t)、从所述归一化hoa数据帧表示中减去所述主要声音信号以及选择所述环境分量camb(t)的系数序列的至少一部分,其中,||camb(t)||22≤||c(t)||22,以及通过计算对所得到的最小环境分量camb,min(t)进行变换,其中,并且ψmin是所述最小环境分量camb,min(t)的模矩阵;
14、c)选择所述hoa系数序列c(t)的一部分,其中,所选择的系数序列与对其实施空间变换的环境hoa分量的系数序列相关,并且描述所选择的系数序列的数量的最小阶数nmin为nmin≤9;
15、-将用于表示所述通道信号的所述非差分增益值所需的所述最小整数比特数βe设置为的装置,
16、其中,n是阶数,nmax是感兴趣的最大阶数,是所述虚拟扬声器的方向,o=(n+1)2是hoa系数序列的数量,以及k是所述模矩阵的欧几里德范数的平方||ψ||22与o之间的比值。
本文地址:https://www.jishuxx.com/zhuanli/20240618/22060.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表