技术新讯 > 乐器声学设备的制造及制作,分析技术 > 用于推迟音频分量的响度调整的方法和系统与流程 > 正文

用于推迟音频分量的响度调整的方法和系统与流程

国知局
2024-06-21 11:38:54

本公开的一方面涉及一种包括编码器的系统，该编码器产生比特流，该比特流具有音频场景的编码音频内容，并且包括与音频内容相关联的响度元数据，解码器使用该响度元数据来控制音频场景的响度。还描述了其他方面。

背景技术：

1、如今，许多设备向用户提供在互联网上流式传输媒体内容(诸如可包括音乐、播客、实况录制的短视频片段或正片的声音节目)的能力。例如，回放设备(诸如数字媒体播放器)可电子耦接到诸如扬声器的输出设备(或输出设备的一部分)，并且可被配置为流式传输内容以通过扬声器进行回放。该内容可由用户选择(例如，通过回放设备的图形用户界面)，并且从在订阅基础上提供内容的一个或多个内容提供者流式传输。

技术实现思路

1、本公开的一方面是一种用于将音频内容和描述该音频内容的一个或多个响度水平的元数据编码成一个或多个(例如，音频)比特流的编码器侧方法，其可由电子设备(例如，媒体内容设备)执行。该编码器侧接收与音频场景相关联的音频分量，该音频分量包括音频信号；基于该音频信号来确定该音频分量的源响度；接收该音频分量的目标响度；通过对该音频信号进行编码并且包括具有该源响度和该目标响度的元数据来产生具有该音频分量的比特流；以及向电子设备传输该比特流。

2、在一个方面，该音频信号是构成该音频分量的整个音频信号的一部分，其中该源响度是跨接收的该整个音频信号的该部分的平均响度。在另一个方面，该部分是第一部分，并且该源响度是第一源响度，其中该方法还包括：接收在该第一部分之后接收的该整个音频信号的第二部分；基于该第一部分和该第二部分来确定第二源响度；以及传输该第二源响度作为包括该整个音频信号的编码第二部分的该比特流中的元数据。在一些方面，该第二源响度比该第一源响度收敛得更接近于或等于该整个音频信号的总体响度。在一个方面，确定该源响度包括从存储器检索该源响度，其中该源响度是跨越该音频信号的长度的总体响度。在另一个方面，确定该音频分量的该源响度包括将该音频信号应用于响度模型。

3、在一个方面，基于该音频分量的该源响度和该目标响度来确定该音频场景的音频场景响度，其中该音频场景响度被包括在该元数据中。在另一个方面，确定该音频场景响度包括：基于该目标响度和该源响度之间的差异来确定标量增益；以及通过将该标量增益应用于该音频信号来产生经增益调整的音频信号，其中使用该经增益调整的音频信号来确定该音频场景响度。

4、在一个方面，该音频分量是第一音频分量，该音频信号是第一音频信号，该源响度是第一源响度，并且该目标响度是第一目标响度，其中该方法还包括：接收与该音频场景相关联的第二音频分量，该第二音频分量包括第二音频信号；基于该第二音频信号来确定该第二音频分量的第二源响度；以及接收该第二音频分量的第二目标响度，其中该比特流通过该第一音频分量和该第二音频分量，连同作为该元数据的该第一源响度、该第二源响度、该第一目标响度和该第二目标响度来产生。在另一个方面，该第一目标响度不同于该第二目标响度。在另一个方面，该第一目标响度和该第二目标响度是相同的。在一些方面，该标量增益是第一标量增益，其中该方法还包括：通过将该第一标量增益应用于该第一音频信号来产生第一经增益调整的音频信号，其中该第一标量增益基于该第一目标响度和该第一源响度之间的差异；通过将第二标量增益应用于该第二音频信号来产生第二经增益调整的音频信号，其中该第二标量增益基于该第二目标响度和该第二源响度之间的差异；基于该第一经增益调整的音频信号和该第二经增益调整的音频信号来确定该音频场景的音频场景响度水平，以及将该音频场景响度水平添加到该元数据。

5、在一个方面，产生该比特流包括将该源响度和该目标响度两者转换成相应的8位整数并且将该8位整数中的每一者作为该元数据的一部分存储到该比特流中。在另一个方面，该比特流包括具有该元数据的编码音频信号，其中该编码音频信号的信号电平与所接收的音频信号的信号电平相同。在一个方面，该目标响度是第一目标响度，并且该比特流是第一比特流，其中该方法还包括：在接收该第一目标响度之后接收第二目标响度；以及通过对该音频信号进行编码并包括具有该源响度和该第二目标响度的新元数据来产生第二比特流。在一些方面，经由用户输入设备接收该第二目标响度。在另一个方面，该音频分量包括该音频信号所属的多个音频信号，其中该目标响度与该多个音频信号相关联。在一个方面，该多个音频信号呈表示该音频场景内的该音频分量的高阶高保真度立体声响复制(hoa)格式。

6、根据本公开的另一个方面是一种用于对音频内容和描述该音频内容的一个或多个响度水平的元数据进行解码的解码器侧方法，其可由电子设备(例如，音频回放设备)执行。该解码器侧接收由编码器侧产生的比特流，该比特流包括：1)与音频场景相关联的第一音频分量的第一音频信号、该第一音频分量的第一目标响度、以及由该编码器侧基于该第一音频信号来确定的该第一音频分量的第一响度，和2)与该音频场景相关联的第二音频分量的第二音频信号、该第二音频分量的第二目标响度、以及由该编码器侧基于该第二音频信号来确定的该第二音频分量的第二响度；基于该第一响度和该第一目标响度来确定第一标量增益；基于该第二响度和该第二目标响度来确定第二标量增益；通过将该第一标量增益应用于该第一音频信号来产生第一经增益调整的音频信号；通过将该第二标量增益应用于该第二音频信号来产生第二经增益调整的音频信号；以及通过将该第一经增益调整的音频信号和该第二经增益调整的音频信号组合成一组一个或多个信号来产生包括该第一音频分量和该第二音频分量的该音频场景。

7、在一个方面，基于该第一目标响度和该第一源响度之间的差异来确定该第一标量增益，并且基于该第二目标响度和该第二源响度之间的差异来确定该第二标量增益。在另一个方面，该第一标量增益不同于该第二标量增益。在一些方面，该第一标量增益和该第二标量增益相同。在一个方面，该比特流的元数据包括由该编码器确定的音频场景响度，其中该方法还包括通过应用该音频场景响度来产生经增益调整的信号组。在另一个方面，该编码器基于包括该第一经增益调整的音频通道和该第二经增益调整的音频通道的混合通道来确定该音频场景响度。在一些方面，产生该经增益调整的信号组：基于该场景目标响度和该音频场景响度之间的差异来产生标准化增益；以及将该标准化增益应用于该信号组。在一个方面，该第一源响度、该第二源响度、该第一目标响度和该第二目标响度各自是该元数据内的8位整数。在另一个方面，可在空间上渲染该音频场景以用于通过电子设备的一个或多个扬声器回放。

8、根据本公开的另一个方面，一种音频解码器装置包括：处理器；和存储器，该存储器在其中存储有指令，该指令将该处理器配置为获得比特流，该比特流包括：音频场景的多个编码音频分量；针对该多个音频分量中的每个音频分量，由音频编码器装置通过对该音频分量的音频信号执行响度测量过程来确定的该音频分量的源响度；由该音频编码器装置接收的该音频分量的目标响度；和由该音频编码器装置通过对多个经增益调整的音频信号执行该响度测量过程来估计的该音频场景的音频场景响度，其中由该音频编码器装置通过基于相应音频分量的该源响度和该目标响度应用标准化增益来针对该相应音频分量产生每个经增益调整的音频信号。根据权利要求29所述的音频解码器装置，其中该音频信号是构成该音频分量的整个音频信号的一部分，其中该源响度是跨接收的该整个音频信号的该部分的平均响度。

9、在一个方面，该部分是第一部分并且该源响度是第一源响度，其中该存储器还具有将该处理器配置为获得附加比特流的指令，该附加比特流包括：该整个音频信号的第二部分的编码版本；和由该音频编码器装置通过对该整个音频信号的该第一部分和该第二部分执行响度测量过程来确定的第二源响度，其中该第二源响度是跨该第一部分和该第二部分的平均响度。在另一个方面，该第二源响度比该第一源响度收敛得更接近于该整个音频信号的总体响度。在一些方面，该比特流包括若干音频通道组，每个音频通道组表示编码音频分量，其中该比特流包括指示该比特流内的该音频通道组的数量的8位整数。

10、以上概述不包括本公开的所有方面的详尽列表。可预期的是，本公开包括可由上文概述的各个方面以及在下文的具体实施方式中公开并且在权利要求书中特别指出的各个方面的所有合适的组合来实践的所有系统和方法。此类组合可具有未在上述技术实现要素：中具体阐述的特定优点。