包括编码HOA表示的位流的解码方法和装置、以及介质与流程
- 国知局
- 2024-06-21 11:51:47
本发明涉及用于改善对声场的高阶高保真度立体声响复制表示(higher orderambisonics representation)进行编码所需的边信息的编码的方法和装置。
背景技术:
1、除了诸如波场合成(wfs)或诸如22.2多通道音频格式的基于通道的方法的其它技术以外,高阶高保真度立体声响复制(hoa)也提供表现三维声音的一种可能性。与基于通道的方法对照,hoa表示提供与特定扬声器设置无关的优点。但是,这种灵活性以特定扬声器设置上的hoa表示的回放所需要的解码处理为代价。与所需的扬声器的数量通常非常大的wfs方法相比,hoa信号也可被呈现给仅包含很少的扬声器的设置。hoa的另一优点在于,可以在不对头戴式耳机(headphone)的双耳呈现进行任何修改的情况下使用同一表示。
2、hoa基于按照截短的球面谐波(sh)展开(expansion)的复杂平面谐波振幅的空间密度的表示。各展开系数是角频率的函数,该函数可以用时域函数等同地表示。由此,不失一般性,整个hoa声场表示实际上可被假定为包含o个时域函数,这里,o标记展开系数的数量。以下,这些时域函数将被等同地称为hoa系数序列或者hoa通道。
3、随着展开的最高阶n增大,hoa表示的空间分辨率提高。不幸的是,展开系数的数量o随着阶n二次生长,具体地,o=(n+1)2。例如,利用阶n=4的典型的hoa表示需要o=25个hoa(展开)系数。根据前面所作的考虑,给定希望的单通道采样率fs和每个样本的位数nb,传送hoa表示的总位速率由o·fs·nb确定。因此,通过使用nb=16位每采样、以fs=48khz的采样率传送阶n=4的hoa表示导致19.2mbits/s的位速率,这对于诸如例如流传输的许多实际应用来说非常高。因此,非常希望压缩hoa表示。
4、在wo 2013/171083a1、ep 13305558.2和pct/ep2013/075559中提出hoa声场表示的压缩。这些处理的共同之处在于,它们执行声场分析并且将给定的hoa表示分解成方向成分和残留环境成分。一方面,最终的压缩表示被假定为包含由环境hoa成分的相关系数序列和方向信号的感知编码得到的数个量化信号。另一方面,假定它包含与量化信号相关的另外的边信息,该边信息是从其压缩版本重构hoa表示所需要的。
5、该边信息的重要部分是从方向信号预测原始hoa表示的多个部分的描述。由于对于该预测来说,原始hoa表示被假定为由从空间均匀分布的方向冲击的数个空间分散的一般平面波等同地代表,因此,以下,预测被称为空间预测。
6、在iso/iec jtc1/sc29/wg11,n14061,“working draft text of mpeg-h 3daudio hoa rm0”,november 2013,geneva,switzerland中描述了与空间预测有关的这种边信息的编码。但是,边信息的该现有技术编码相当不足。
技术实现思路
1、本发明要解决的一个问题是提供编码与该空间预测有关的边信息的更有效的方式。
2、通过在本发明中公开的方法解决该问题。在本发明中还公开了利用这些方法的装置。
3、位被预先安排给编码的边信息表示数据ζcod,该位用于表示是否要执行任何预测。该特征随时间减少传送ζcod数据的平均位速率。此外,在特定的情形中,作为使用对各方向指示是否执行预测的位阵列的替代,传送或传递活动的预测的数量和各指标更有效的。单个位可用于指示被推想为执行预测的方向的指标以何种方式被编码。平均来说,该操作随时间进一步减小传送ζcod数据的位速率。
4、原则上,本发明的方法适于改善用高阶高保真度立体声响复制(标记为hoa)系数序列的输入时间帧编码声场的hoa表示所需要的边信息的编码,其中,主导方向信号以及残留环境hoa成分被确定,并且,预测被用于所述主导方向信号,由此对hoa系数的编码帧提供描述所述预测的边信息数据,并且其中,所述边信息数据可包含:
5、-表示是否对方向执行预测的位阵列;
6、-其中每个位对于要执行预测的方向指示预测的类型的位阵列;
7、-其要素关于要执行的预测表示要使用的方向信号的指标的数据阵列;
8、-其要素代表量化的缩放因子的数据阵列,
9、所述方法包括以下步骤:
10、-提供指示是否要执行所述预测的位值;
11、-如果不执行预测,那么在所述边信息数据中省略所述位阵列和所述数据阵列;
12、-如果要执行所述预测,那么,作为所述表示是否对方向执行预测的位阵列的替代,提供指示活动的预测的数量和包含要执行预测的方向的指标的数据阵列是否包含于所述边信息数据中的位值。
13、原则上,本发明的装置适于改善用高阶高保真度立体声响复制(标记为hoa)系数序列的输入时间帧编码声场的hoa表示所需要的边信息的编码,其中,主导方向信号以及残留环境hoa成分被确定,并且,预测被用于所述主导方向信号,由此对hoa系数的编码帧提供描述所述预测的边信息数据,并且其中,所述边信息数据可包含:
14、-表示是否对方向执行预测的位阵列;
15、-其中每个位对于要执行预测的方向指示预测的类型的位阵列;
16、-其要素关于要执行的预测表示要使用的方向信号的指标的数据阵列;
17、-其要素代表量化的缩放因子的数据阵列,
18、所述装置包括以下部件,其:
19、-提供指示是否要执行所述预测的位值;
20、-如果不执行预测,那么在所述边信息数据中省略所述位阵列和所述数据阵列;
21、-如果要执行所述预测,那么,作为所述表示是否对方向执行预测的位阵列的替代,提供指示活动的预测的数量和包含要执行预测的方向的指标的数据阵列是否包含于所述边信息数据中的位值。
22、本发明的有利的另外的实施例在各独立的权利要求中被公开。
技术特征:1.一种用于对包括编码的高阶高保真度立体声响复制hoa表示的位流进行解码的方法,所述方法包括:
2.一种用于对包括编码的高阶高保真度立体声响复制hoa表示的位流进行解码的装置,所述装置包括:
3.一种计算机程序产品,包含指令,所述指令在计算机上执行时使得计算机实行如权利要求1所述的方法。
4.一种用于对包括编码的高阶高保真度立体声响复制hoa表示的位流进行解码的设备,包括:
5.一种用于对包括编码的高阶高保真度立体声响复制hoa表示的位流进行解码的装置,该装置包含用于执行如权利要求1所述的方法的部件。
6.一种计算机可读存储介质,存储有指令,所述指令在所述处理器上执行时使得该处理器执行如权利要求1所述的方法。
7.一种用于改善用被记为hoa的高阶高保真度立体声响复制系数序列的输入时间帧编码声场的hoa表示所需要的边信息的编码的方法,其中,主导方向信号以及残留环境hoa成分被确定,并且,预测被用于所述主导方向信号,由此对hoa系数的编码帧提供描述所述预测的边信息数据,其中,所述边信息数据能够包含:
8.一种用于改善用被记为hoa的高阶高保真度立体声响复制系数序列的输入时间帧编码声场的hoa表示所需要的边信息的编码的装置,其中,主导方向信号以及残留环境hoa成分被确定,并且,预测被用于所述主导方向信号,由此对hoa系数的编码帧提供描述所述预测的边信息数据,其中,所述边信息数据能够包含:
技术总结本公开涉及包括编码HOA表示的位流的解码方法和装置、以及介质。高阶高保真度立体声响复制代表与特定扬声器设置无关的三维声音。但是,传送HOA表示导致非常高的位速率。因此,使用具有固定数量的通道的压缩,其中,方向和环境信号成分以不同的方式被处理。对于编码,从方向信号成分预测原始HOA表示的多个部分。这种预测提供相应解码所需要的边信息。通过使用一些附加的特定目的位,已知边信息编码处理得到改善,这在于用于编码该边信息的需要的位数平均减少。技术研发人员:A·克鲁埃格尔,S·科尔多恩,O·伍埃博尔特受保护的技术使用者:杜比国际公司技术研发日:技术公布日:2024/5/12本文地址:https://www.jishuxx.com/zhuanli/20240618/24060.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表