技术新讯 > 乐器声学设备的制造及制作,分析技术 > 用于产生或解码包括沉浸式音频信号的位流的方法及装置与流程 > 正文

用于产生或解码包括沉浸式音频信号的位流的方法及装置与流程

国知局
2024-10-09 14:56:47

本文档涉及可包括声场表示信号，尤其是环绕立体声信号的沉浸式音频信号。特定来说，本文档涉及产生及解码包括沉浸式音频信号的位流。

背景技术：

1、可使用环绕立体声信号来描述位于收听位置处的收听者的收听环境内的声音或声场。环绕立体声信号可被视为多声道音频信号，其中每一声道对应于收听者的收听位置处的声场的特定方向性图案。可使用三维(3d)笛卡尔坐标系来描述环绕立体声信号，其中所述坐标系的原点对应于收听位置，x轴指向前方，y轴指向左侧且z轴指向上方。

2、通过增加音频信号或声道的数目且通过增加对应方向性图案(及对应平移函数)的数目，可增加描述声场的精度。举例来说，一阶环绕立体声信号包括4个声道或波形，即指示声场的全向分量的w声道、描述具有对应于x轴的偶极子方向性图案的声场的x声道、描述具有对应于y轴的偶极子方向性图案的声场的y声道及描述具有对应于z轴的偶极子方向性图案的声场的z声道。二阶环绕立体声信号包括9个声道，其包含一阶环绕立体声信号的4个声道(也被称为b格式)加上不同方向性图案的5个额外声道。一般来说，l阶环绕立体声信号包括(l+1)2个声道，包含(l-1)阶环绕立体声信号的l2个声道加上额外方向性图案的[(l+1)2-l2]个额外声道(当使用3d环绕立体声格式时)。l>1的l阶环绕立体声信号可被称为高阶环绕立体声(hoa)信号。

3、hoa信号可用于独立于扬声器的布置来描述3d声场，所述布置用于渲染hoa信号。扬声器的实例布置包括耳机或扬声器的一或多个布置或虚拟现实渲染环境。因此，可能有益的是，将hoa信号提供给音频渲染器，以便允许音频渲染器灵活地适应扬声器的不同布置。

4、声场表示(sr)信号，例如环绕立体声信号，可用音频对象及/或多声道信号来补充，以提供沉浸式音频(ia)信号。本文档解决按带宽有效方式以高感知质量传输及/或存储ia信号的技术问题。特定来说，本文档解决提供指示ia信号的有效位流的技术问题。

技术实现思路

1、根据一个方面，描述一种用于产生位流的方法，其中所述位流包括用于沉浸式音频信号的帧序列的超帧序列。所述方法包括针对所述超帧序列重复地，将从所述沉浸式音频信号导出的一或多个降混声道信号的一或多个帧的经编码音频数据插入到超帧的数据字段中。此外，所述方法包括将用于从所述经编码音频数据重构所述沉浸式音频信号的一或多个帧的元数据，尤其是经编码元数据插入到所述超帧的元数据字段中。

2、根据另一方面，描述一种用于从位流导出有关沉浸式音频信号的数据的方法，其中所述位流包括用于所述沉浸式音频信号的帧序列的超帧序列。所述方法包括针对所述超帧序列重复地，从超帧的数据字段提取从所述沉浸式音频信号导出的一或多个降混声道信号的一或多个帧的经编码音频数据。此外，所述方法包括从所述超帧的元数据字段提取用于从所述经编码音频数据重构所述沉浸式音频信号的一或多个帧的元数据。

3、根据进一步方面，描述一种软件程序。所述软件程序可经调适以在处理器上执行且当在所述处理器上实行时执行本文档中所概述的方法步骤。

4、根据另一方面，描述一种存储媒体。所述存储媒体可包括经调适以在处理器上执行且当在所述处理器上实行时执行本文档中所概述的方法步骤的软件程序。

5、根据进一步方面，描述一种计算机程序产品。所述计算机程序产品可包括用于当在计算机上执行时执行本文档中所概述的方法步骤的可执行指令。

6、根据进一步方面，描述一种位流的超帧，其中所述位流包括用于沉浸式音频信号的帧序列的超帧序列。所述超帧包括用于从所述沉浸式音频信号导出的一或多个降混声道信号的一或多个(尤其是多个)帧的经编码音频数据的数据字段。此外，所述超帧包括用于元数据的(单个)元数据字段，所述元数据经调适以从所述经编码音频数据重构所述沉浸式音频信号的一或多个(尤其是多个)帧。

7、根据另一方面，描述一种编码装置，其经配置以产生位流。所述位流包括用于沉浸式音频信号的帧序列的超帧序列。所述编码装置经配置以针对所述超帧序列重复地，将从所述沉浸式音频信号导出的一或多个降混声道信号的一或多个(尤其是多个)帧的经编码音频数据插入到超帧的数据字段中；及将用于从所述经编码音频数据重构所述沉浸式音频信号的一或多个(尤其是多个)帧的元数据插入到所述超帧的元数据字段中。

8、根据进一步方面，描述一种解码装置，其经配置以从位流导出有关沉浸式音频信号的数据，其中所述位流包括用于所述沉浸式音频信号的帧序列的超帧序列。所述解码装置经配置以针对所述超帧序列重复地，从超帧的数据字段提取从所述沉浸式音频信号导出的一或多个降混声道信号的一或多个(尤其是多个)帧的经编码音频数据；及从所述超帧的元数据字段提取用于从所述经编码音频数据重构所述沉浸式音频信号的一或多个(尤其是多个)帧的元数据。

9、应注意，所述方法、装置及系统(包含如本专利申请案中所概述的其优选实施例)可独立地使用或组合本文档中所揭示的其它方法、装置及系统使用。此外，本专利申请案中所概述的方法、装置及系统的所有方面可任意地组合。

技术特征：

1.一种用于产生位流(101)的方法(500)；其中所述位流(101)包括用于沉浸式音频信号(111)的帧序列的超帧(400)序列；其中所述方法(500)包括针对所述超帧(400)序列重复地，

2.根据权利要求1所述的方法(500)，其中

3.根据权利要求2所述的方法(500)，其中

4.根据前述权利要求中任一权利要求所述的方法(500)，其中

5.根据前述权利要求中任一权利要求所述的方法(500)，其中

6.根据前述权利要求中任一权利要求所述的方法(500)，其中使用增强型语音服务编码器来对降混声道信号(203)的帧的所述经编码音频数据(206)进行编码。

7.根据前述权利要求中任一权利要求所述的方法(500)，其中所述超帧(400)构成使用传输协议，尤其是dash、rtsp或rtp传输或根据存储格式，尤其是isobmff存储在文件中的数据元素的至少一部分。

8.根据前述权利要求中任一权利要求所述的方法(500)，其中

9.根据前述权利要求中任一权利要求所述的方法(500)，其中所述方法(500)包括

10.根据前述权利要求中任一权利要求所述的方法(500)，其中所述方法(500)包括

11.一种位流(101)的超帧(400)；其中所述位流(101)包括用于沉浸式音频信号(111)的帧序列的超帧(400)序列；其中所述超帧(400)包括

12.一种编码装置(110)，其经配置以产生位流(101)；其中所述位流(101)包括用于沉浸式音频信号(111)的帧序列的超帧(400)序列；其中所述编码装置(110)经配置以针对所述超帧(400)序列重复地，

技术总结本公开涉及用于产生或解码包括沉浸式音频信号的位流的方法及装置。本文档描述一种用于产生位流(101)的方法(500)，其中所述位流(101)包括用于沉浸式音频信号(111)的帧序列的超帧(400)序列。所述方法(500)包括针对所述超帧(400)序列重复地将从所述沉浸式音频信号(111)导出的一或多个降混声道信号(203)的一或多个帧的经编码音频数据(206)插入(501)到超帧(400)的数据字段(411、421、412、422)中；及将用于从所述经编码音频数据(206)重构所述沉浸式音频信号(111)的一或多个帧的元数据(202、205)插入(502)到所述超帧(400)的元数据字段(403)中。技术研发人员：S·布鲁恩,J·F·托里斯受保护的技术使用者：杜比实验室特许公司技术研发日：技术公布日：2024/9/29