技术新讯 > 电子电路装置的制造及其应用技术 > 用于获得用于熵编码或熵解码数据的累积分布函数的方法和装置与流程 > 正文

用于获得用于熵编码或熵解码数据的累积分布函数的方法和装置与流程

国知局
2024-08-19 14:33:05

背景技术：：：1、几十年来，混合图像和视频编解码器一直被用于压缩图像和视频数据。在这种编解码器中，通常通过预测块并通过仅对原始块与其预测之间的差异进行进一步编码来对信号进行按块编码。具体地，这种编码可以包括变换、量化和生成码流，通常包括一些熵编码。通常，混合编码方法的三个组成部分(即变换、量化和熵编码)被单独优化。现代视频压缩标准(如高效视频编码(high-efficiency video coding，hevc)、通用视频编码(versatilevideo coding，vvc)和基本视频编码(essential video coding，evc))也使用变换后的表示来编码预测后的残差信号。2、最近，神经网络架构已应用于图像和/或视频译码。通常，这些基于神经网络(neural network，nn)的方法可以以各种不同的方式应用于图像和视频译码。例如，已经讨论了一些端到端优化的图像或视频译码框架。此外，深度学习已被用于确定或优化端到端译码框架的一些部分，例如预测参数的选择或压缩等。此外，还讨论了一些基于神经网络的方法，用于混合图像和视频译码框架，例如，用于作为经训练的深度学习模型实现，用于图像或视频译码中的帧内或帧间预测。3、上面讨论的端到端优化图像或视频译码应用的共同点是，它们产生一些特征图数据，这些特征图数据将在编码器与解码器之间传输。4、神经网络是机器学习模型，这些机器学习模型使用一层或多层非线性单元，基于这些非线性单元，它们可以预测接收到的输入的输出。一些神经网络除了输出层之外，还包括一个或多个隐藏层。可以提供对应的特征图作为每个隐藏层的输出。每个隐藏层的这种对应特征图可以用作网络中的后续层的输入，即后续隐藏层或输出层。网络的每个层根据相应参数集的当前值从接收到的输入生成输出。在设备之间(例如在编码器与解码器之间、在设备与云之间)或在不同设备之间划分的神经网络中，划分位置(例如第一设备)的输出侧的特征图被压缩并传输到该神经网络的剩余层(例如第二设备)。5、期望使用经训练的网络架构进一步改进编码和解码。技术实现思路1、本发明实施例提供了用于获得用于熵编码和熵解码的累积分布函数的装置和方法。2、本发明实施例由独立权利要求的特征限定，实施例的其它有利实现方式由从属权利要求的特征限定。3、根据一个实施例，提供了一种用于将数据熵编码到码流中的方法，所述方法包括：在多个区间中的至少一个区间内获得累积分布函数(cumulative distributionfunction，cdf)，其中，所述cdf是基于在所述至少一个区间中由二阶多项式的参数定义的函数获得的，所述二阶多项式满足条件集；通过应用基于在所述至少一个区间中获得的所述cdf的概率模型，熵编码所述数据。4、基于描述二阶多项式的参数集获得cdf提供了一种可靠和可再现的方法来获得对熵编码中使用的概率模型的估计。该函数表示使用二阶多项式对cdf的近似，而条件使近似能够更好地适应cdf的一些固有特征。5、在示例性实现方式中，所述条件集包括以下中的一个或多个：所述至少一个区间内的二阶多项式和相邻区间内的多项式提供单调非递减函数，所述二阶多项式在所述至少一个区间内具有非负导数。6、这些条件表示由函数提供的近似的特定特性，即单调性、曲率等。它们反映了cdf的特征，因此产生了适合在熵编码中用作cdf的近似。7、例如，由参数定义的函数表示具有预定义平均值和预定义标准偏差的预定义cdf。8、提供预定义cdf的优点在于：这样的预定义cdf可以在必要时高效地存储或推导，同时可以基于预定义cdf获得可能的其它cdf。9、在示例性实现方式中，所述cdf是通过移位所述函数的至少一个自变量获得的。10、移位自变量可以使用函数提供的近似来获得附加cdf，该附加cdf具有例如不同于在获得函数时使用的预定义平均值的平均值。只需要存储或推导预定义cdf的参数。11、例如，所述cdf是通过缩放所述函数的至少一个自变量获得的。12、缩放自变量可以使用函数提供的近似来获得附加cdf，该附加cdf具有例如不同于在获得函数时使用的预定义标准偏差的标准偏差。只需要存储或推导预定义cdf的参数。13、在示例性实现方式中，所述熵编码是算术编码。14、算术编码是一种高效的熵编码，可以有助于降低速率。它可以有利地使用如上所述获得的cdf近似。15、例如，所述多个区间中的一个或多个区间内的所述函数由线性多项式定义。16、例如，在具有几乎恒定斜率的区域中使用线性近似可以减少为指定近似函数而提供的参数的数量。17、在示例性实现方式中，所述多个区间中的最后一个区间内的所述函数由线性多项式定义。18、在最后一个区间中，cdf近似于渐近值1。因此，线性近似减少了参数的数量，但不会显著降低近似的精度。19、例如，所述函数近似具有预定义平均值和预定义标准偏差的预定义cdf，所述函数相对于所述预定义平均值是点对称的，并且所述函数在包括高于所述预定义平均值的值的区间中定义。20、利用cdf的对称性会减少区间的数量，从而减少为指定近似函数而提供的参数的数量。这导致对参数存储的要求较低。21、在示例性实现方式中，查找表(look-up table，lut)提供每个区间的所述参数。22、查找表为参数集提供了高效的实现方式。23、例如，获得的cdf表示高斯分布的cdf。24、该方法很容易应用于高斯cdf，该高斯cdf通常用于熵编码。25、在示例性实现方式中，所述参数采用具有预定义精度的定点表示。26、这种定点表示与预定义精度一起可以提供相同的精度和相同的定点表示，从而在不同类型的平台(硬件和/或软件)上产生相同的值。cdf的值相同会使编码器和解码器处的符号和范围的映射相同，从而实现兼容性并确保同步的熵编码和熵解码(即跨不同软件和硬件平台的确定性熵译码)。27、例如，在获得所述cdf时，根据规则集，将中间结果调整到预定义精度。28、将中间结果调整到预定义精度进一步确保了不同平台之间的兼容性和同步的熵编码和熵解码。29、在示例性实现方式中，对于所述至少一个区间内的值x＝s–μ–0.5，其中，s表示待编码符号，μ是所述cdf的平均值，对于小于零的x，所述cdf是通过cdf(x)＝m–(aiv2+biv+ci)+s获得的，其中，ai、bi和ci是所述至少一个区间内的二阶多项式的所述参数，对于小于零的x和小预定义参数∈>0，所述参数通过所述cdf的所述标准偏差σleft缩放所述值x，与所述预定义精度相关的倍增因数m由m＝总数–smax–1定义，其中，总数与熵编码中使用的位数相关，smax是待编码符号的最大值；对于大于零的x，所述cdf是通过cdf(x)＝aiv2+biv+ci+s获得的，其中，ai、bi和ci是所述至少一个区间内的二阶多项式的所述参数，对于大于零的x和小预定义参数∈>0，所述参数通过所述cdf的所述标准偏差σleft缩放所述值x。30、这种移位和缩放的组合提供了一种高效的实现方式来在区间i中从参数子集ai、bi、ci获得cdf。31、根据一个实施例，提供了一种用于从码流中熵解码数据的方法，所述方法包括：在多个预定区间中的至少一个区间内获得累积分布函数(cumulative distributionfunction，cdf)，其中，所述cdf是基于在所述至少一个区间中由二阶多项式的参数定义的函数获得的，所述二阶多项式满足条件集；通过应用基于在所述至少一个区间中获得的所述cdf的概率模型，熵解码所述数据。32、基于描述二阶多项式的参数集获得cdf提供了一种可靠和可再现的方法来获得对熵编码中使用的概率模型的估计。该函数表示使用二阶多项式对cdf的近似，而条件使近似能够更好地适应cdf的一些固有特征。33、在示例性实现方式中，所述条件集包括以下中的一个或多个：所述至少一个区间内的二阶多项式和相邻区间内的多项式提供单调非递减函数，所述二阶多项式在所述至少一个区间内具有非负导数。34、这些条件表示由函数提供的近似的特定特性，即单调性、曲率等。它们反映了cdf的特征，因此产生了适合在熵编码中用作cdf的近似。35、例如，由参数定义的函数表示具有预定义平均值和预定义标准偏差的预定义cdf。36、提供预定义cdf的优点在于：这样的预定义cdf可以在必要时高效地存储或推导，同时可以基于预定义cdf获得可能的其它cdf。37、在示例性实现方式中，所述cdf是通过移位所述函数的至少一个自变量获得的。38、移位自变量可以使用函数提供的近似来获得附加cdf，该附加cdf具有例如不同于在获得函数时使用的预定义平均值的平均值。只需要存储或推导预定义cdf的参数。39、例如，所述cdf是通过缩放所述函数的至少一个自变量获得的。40、缩放自变量可以使用函数提供的近似来获得附加cdf，该附加cdf具有例如不同于在获得函数时使用的预定义标准偏差的标准偏差。只需要存储或推导预定义cdf的参数。41、在示例性实现方式中，所述熵解码是算术解码。42、算术解码是一种高效的熵编码，可以有助于降低速率。它可以有利地使用如上所述获得的cdf近似。43、例如，所述多个区间中的一个或多个区间内的所述函数由线性多项式定义。44、例如，在具有几乎恒定斜率的区域中使用线性近似可以减少为指定近似函数而提供的参数的数量。45、在示例性实现方式中，所述多个区间中的最后一个区间内的所述函数由线性多项式定义。46、在最后一个区间中，cdf近似于渐近值1。因此，线性近似减少了参数的数量，但不会显著降低近似的精度。47、例如，所述函数近似具有预定义平均值和预定义标准偏差的预定义cdf，所述函数相对于所述预定义平均值是点对称的，并且所述函数在包括高于所述预定义平均值的值的区间中定义。48、利用cdf的对称性会减少区间的数量，从而减少为指定近似函数而提供的参数的数量。这导致对参数存储的要求较低。49、在示例性实现方式中，查找表(look-up table，lut)提供每个区间的所述参数。50、查找表为参数集提供了高效的实现方式。51、例如，获得的cdf表示高斯分布的cdf。52、该方法很容易应用于高斯cdf，该高斯cdf通常用于熵解码。53、在示例性实现方式中，所述参数采用具有预定义精度的定点表示。54、这种定点表示与预定义精度一起可以提供相同的精度和相同的定点表示，从而在不同类型的平台(硬件和/或软件)上产生相同的值。cdf的值相同会使编码器和解码器处的符号和范围的映射相同，从而实现兼容性并确保同步的熵编码和熵解码(即跨不同软件和硬件平台的确定性熵译码)。55、例如，在获得所述cdf时，根据规则集，将中间结果调整到预定义精度。56、将中间结果调整到预定义精度进一步确保了不同平台之间的兼容性和同步的熵编码和熵解码。57、在示例性实现方式中，对于所述至少一个区间内的值x＝s–μ–0.5，其中，s表示待编码符号，μ是所述cdf的平均值，对于小于零的x，所述cdf是通过cdf(x)＝m–(aiv2+biv+ci)+s获得的，其中，ai、bi和ci是所述至少一个区间内的二阶多项式的所述参数，对于小于零的x和小预定义参数∈>0，所述参数通过所述cdf的所述标准偏差σleft缩放所述值x，与所述预定义精度相关的倍增因数m由m＝总数–smax–1定义，其中，总数与熵编码中使用的位数相关，smax是待编码符号的最大值；对于大于零的x，所述cdf是通过cdf(x)＝aiv2+biv+ci+s获得的，其中，ai、bi和ci是所述至少一个区间内的二阶多项式的所述参数，对于大于零的x和小预定义参数∈>0，所述参数通过所述cdf的所述标准偏差σleft缩放所述值x。58、这种移位和缩放的组合提供了一种高效的实现方式来在区间i中从参数子集ai、bi、ci获得cdf。59、根据一个实施例，提供了一种用于获得表示用于熵编码的累积分布函数(cumulative distribution function，cdf)的参数集的方法，所述方法包括：对于多个预定区间内的区间：获得定义在所述区间内的二阶多项式的所述参数集的子集，所述二阶多项式近似所述cdf，其中，所述多项式满足条件集。60、获得描述二阶多项式的参数集实现了一种可靠和可再现的方法来获得cdf的近似，而这些条件使近似能够更好地适应cdf的一些固有特征。61、在示例性实现方式中，所述条件集包括以下中的一个或多个：所述二阶多项式和相邻区间内的多项式提供单调非递减函数，所述二阶多项式在相应区间内具有非负导数。62、这些条件表示函数近似的cdf的特定特性，即单调性、曲率等。它们反映了cdf的特征，因此产生了适合在熵编码中用作cdf的近似。63、例如，由参数定义的函数指定基于预定义平均值和预定义标准偏差的预定义cdf。64、使用预定义cdf的优点在于：这样的预定义cdf可以在必要时高效地存储或推导，同时可以基于预定义cdf获得可能的其它cdf。65、在示例性实现方式中，所述多个区间中的一个或多个区间内的所述函数由线性多项式定义。66、例如，在具有几乎恒定斜率的区域中使用线性近似可以减少为指定近似函数而提供的参数的数量。67、例如，所述多个区间中的最后一个区间内的所述函数由线性多项式定义。68、在最后一个区间中，cdf近似于渐近值1。因此，线性近似减少了参数的数量，但不会显著降低近似的精度。69、在示例性实现方式中，所述函数近似具有预定义平均值和预定义标准偏差的预定义cdf，所述函数相对于所述预定义平均值是点对称的，并且所述函数在包括高于所述预定义平均值的值的区间中定义。70、利用cdf的对称性会减少区间的数量，从而减少为指定近似函数而提供的参数的数量。这导致对参数存储的要求较低。71、例如，每个区间的所述参数存储在查找表(look-up table，lut)中。72、查找表为参数集提供了高效的实现方式。73、在示例性实现方式中，所述cdf表示高斯分布的cdf。74、该方法很容易应用于高斯cdf，该高斯cdf通常用于熵编码。75、例如，所述参数采用具有预定义精度的定点表示。76、这种定点表示与预定义精度一起可以提供相同的精度和相同的定点表示，从而在不同类型的平台(硬件和/或软件)上产生相同的值。cdf的值相同会使编码器和解码器处的符号和范围的映射相同，从而实现兼容性并确保同步的熵编码和熵解码(即跨不同软件和硬件平台的确定性熵译码)。77、在示例性实现方式中，在所述获得时，成本函数被优化，所述成本函数包括所述二阶多项式与所述cdf之间的差值。78、优化成本函数提供了一种高效的实现方式来获得区间内的参数的子集。79、例如，所述成本函数包括惩罚，所述惩罚在所述区间的边界处增大了所述二阶多项式与所述cdf之间的差值。80、这种成本函数增加了靠近区间边界的区域的影响。这使得可以高效地处理在区间边界处要满足的条件。81、在示例性实现方式中，所述成本函数包括惩罚，当由所述二阶多项式定义的抛物线的顶点在所述区间内或所述区间的左侧时，所述惩罚被添加。82、这种惩罚确保函数在区间内单调递增，因此，函数遵循近似的cdf的特性。83、在示例性实现方式中，存储在非瞬时性介质上并包括代码指令的计算机程序，所述代码指令当在一个或多个处理器上执行时，使所述一个或多个处理器执行根据上述任一方法所述的步骤。84、根据一个实施例，提供了一种用于将数据熵编码到码流中的装置，所述装置包括：处理电路，用于：在多个预定区间中的至少一个区间内获得累积分布函数(cumulativedistribution function，cdf)，其中，所述cdf是基于在所述至少一个区间中由二阶多项式的参数定义的函数获得的，所述二阶多项式满足条件集；通过应用基于在所述至少一个区间中获得的所述cdf的概率模型，熵编码所述数据。85、根据一个实施例，提供了一种用于从码流中熵解码数据的装置，所述装置包括：处理电路，用于：在多个预定区间中的至少一个区间内获得累积分布函数(cumulativedistribution function，cdf)，其中，所述cdf是基于在所述至少一个区间中由二阶多项式的参数定义的函数获得的，所述二阶多项式满足条件集；通过应用基于在所述至少一个区间中获得的所述cdf的概率模型，熵解码所述数据。86、根据一个实施例，提供了一种用于获得表示用于熵编码的累积分布函数(cumulative distribution function，cdf)的参数集的装置，所述装置包括处理电路，所述处理电路用于：对于多个预定区间内的区间：获得定义所述区间内的二阶多项式的所述参数集的子集，所述二阶多项式近似所述cdf，其中，所述多项式满足条件集。87、根据一个实施例，提供了一种计算机可读记录介质，用于存储由根据本文描述的任何一个实施例和/或实现方式的熵编码方法或根据本文描述的任何一个实施例和/或实现方式的熵编码装置生成的码流。计算机可读记录介质也可以是或称为计算机可读存储介质，并且可以是例如非瞬时性计算机可读记录介质，例如非瞬时性计算机可读存储介质。88、这些装置提供了上述方法的优点。89、本发明可以在硬件(hardware，hw)和/或软件(software，sw)或其任意组合中实现。此外，基于hw的实现可以与基于sw的实现相结合。90、本文描述的实施例和实现方式可以提供例如正态累积分布函数的低复杂度、定点近似。91、本文描述的实施例和实现方式可用于对静态图像、视频图像和音频信号(例如多声道音频信号)进行译码，从而分别对与静态图像、视频图像和音频信号相关的数据进行熵编码和熵解码，但不限于此。例如，本文描述的实施例和实现方式也可以(以相同或对应的方式)用于获得神经网络的激活函数或用于神经网络的激活函数(而不是获得用于熵编码和/或熵解码的cdf)，其中，所述激活函数是基于在所述至少一个区间中由二阶多项式的参数定义的函数获得的，并且所述二阶多项式满足条件集。神经网络可以用于例如对静态图像、视频图像和音频信号(例如多声道音频信号)进行译码或压缩/解压缩，或用于处理静态图像、视频图像或音频信号(例如用于分类、去噪或其它目的)，或者神经网络可以用于数据加密或其它目的。92、以下附图和说明书详细阐述了一个或多个实施例。其它特征、目的和优点在说明书、附图和权利要求书中是显而易见的。当前第1页12当前第1页12