视频解码方法、装置、存储介质及存储码流的方法与流程
- 国知局
- 2024-09-05 14:34:02
本技术实施例描述总体上涉及视频解码方法、装置及计算机可读存储介质的实施例。
背景技术:
1、本文所提供的背景描述旨在整体呈现本技术的背景。在背景技术部分以及本说明书的各个方面中所描述的目前已署名的发明人的工作所进行的程度,并不表明其在本技术提交时作为现有技术,且从未明示或暗示其被承认为本技术的现有技术。
2、通过具有运动补偿的帧间预测技术,可以进行视频编码和解码。未压缩的数字视频可包括一系列图片,每个图片具有例如1920×1080亮度样本及相关色度样本的空间维度。所述系列图片具有固定的或可变的图片速率(也非正式地称为帧率),例如每秒60个图片或60hz。未压缩的视频具有非常大的比特率要求。例如,每个样本8比特的1080p60 4:2:0的视频(1920×1080亮度样本分辨率,60hz帧率)要求接近1.5gbit/s带宽。一小时这样的视频就需要超过600gb的存储空间。
3、视频编码和解码的一个目的,是通过压缩减少输入视频信号的冗余。视频压缩可以帮助降低对上述带宽或存储空间的要求,在某些情况下可降低两个或更多数量级。无损和有损压缩,以及两者的组合均可采用。无损压缩是指从压缩的原始信号中重建原始信号精确副本的技术。当使用有损压缩时,重建信号可能与原始信号不完全相同,但是原始信号和重建信号之间的失真足够小,使得重建信号可用于预期应用。有损压缩广泛应用于视频。容许的失真量取决于应用。例如,某些消费流媒体应用的用户可以比电视应用的用户容忍更高的失真。可实现的压缩比反映出:较高的允许/容许失真可产生较高的压缩比。
4、视频编码器和解码器可利用几大类技术,例如包括:运动补偿、变换、量化和熵编码。
5、视频编解码器技术可包括已知的帧内编码技术。在帧内编码中,在不参考先前重建的参考图片的样本或其它数据的情况下表示样本值。在一些视频编解码器中,图片在空间上被细分为样本块。当所有的样本块都以帧内模式编码时,该图片可以为帧内图片。帧内图片及其衍生(例如独立解码器刷新图片)可用于复位解码器状态,并且因此可用作编码视频比特流和视频会话中的首个图片,或用作静止图像。帧内块的样本可用于变换,且可在熵编码之前量化变换系数。帧内预测可以是一种使预变换域中的样本值最小化的技术。在某些情形下,变换后的dc值越小,且ac系数越小,则在给定的量化步长尺寸下需要越少的比特来表示熵编码之后的块。
6、如同从诸如mpeg-2代编码技术中所获知的,传统帧内编码不使用帧内预测。然而,一些较新的视频压缩技术包括:试图从例如周围样本数据和/或元数据中得到数据块的技术,其中周围样本数据和/或元数据是在空间相邻块的编码/解码期间、且在解码顺序之前获得的。这种技术后来被称为“帧内预测”技术。需要注意的是,至少在某些情形下,帧内预测仅使用正在重建的当前图片的参考数据,而不使用参考图片的参考数据。
7、可以存在许多不同形式的帧内预测。当在给定的视频编码技术中可以使用超过一种这样的技术时,所使用的技术可以按帧内预测模式进行编码。在某些情形下,模式可具有子模式和/或参数,且这些模式可单独编码或包含在模式码字中。将哪个码字用于给定模式/子模式/参数组合会影响通过帧内预测的编码效率增益,因此用于将码字转换成比特流的熵编码技术也会出现这种情况。
8、h.264引入了一种帧内预测模式,其在h.265中进行了改进,且在诸如联合开发模型(joint exploration model,jem)、通用视频编码(versatile video coding,vvc)、基准集合(benchmark set,bms)等更新的编码技术中进一步被改进。通过使用属于已经可用的样本的相邻样本值可以形成预测块。将相邻样本的样本值按照某一方向复制到预测块中。对所使用方向的引用可以被编码在比特流中,或者本身可以被预测。
9、参照图1a,右下方描绘了来自h.265的33个可能的预测方向(对应于35个帧内模式中的33个角度模式)中已知的九个预测方向的子集。箭头会聚的点(101)表示正在被预测的样本。箭头表示样本正在被预测的方向。例如,箭头(102)表示根据右上方与水平方向成45度角的一个或多个样本,预测样本(101)。类似地,箭头(103)表示根据左下方与水平方向成22.5度角的一个或多个样本,预测样本(101)。
10、仍然参考图1a,在左上方示出了一个包括4×4个样本的正方形块(104)(由粗虚线表示)。正方形块(104)包括16个样本,每个样本用“s”、以及其在y维度(例如行索引)上的位置和在x纬度(例如列索引)上的位置来标记。例如,样本s21是y维度上的第二个样本(从上方开始)和x维度上的第一个样本(左侧开始)。类似地,样本s44在y维度和x维度上都是块(104)中的第四个样本。由于该块为4×4大小的样本,因此s44位于右下角。还示出了遵循类似编号方案的参考样本。参考样本用“r”、以及其相对于块(104)的y位置(例如,行索引)和x位置(例如,列索引)来标记。在h.264与h.265中,预测样本与正在重建的块相邻,因此不需要使用负值。
11、通过复制来自信号通知的预测方向所知的相邻样本的参考样本值,可以进行帧内预测。例如,假设编码视频比特流包括信令,对于该块,该信令指示与箭头(102)一致的预测方向,即,根据右上方与水平方向成45度角的一个或多个预测样本来对样本进行预测。在这种情况下,根据同一参考样本r05,来对样本s41、s32、s23和s14进行预测。然后,根据参考样本r08,来对样本s44进行预测。
12、在某些情况下,例如通过内插,可以合并多个参考样本的值,以便计算出一参考样本,尤其是当方向不能被45度整除时。
13、随着视频编码技术的发展,可能的方向的数量已经增加了。在h.264(2003年)中,可以表示九种不同的方向。在h.265(2013年)中增加到了33个,在jem/vvc/bms中,在本技术提出时,可以支持多达65个方向。已经进行了实验来识别最可能的方向,并且熵编码中的某些技术被用于以少量比特来表示那些较为可能的方向,对于较不可能的方向则接受一定的代价。此外,有时可以根据在相邻的、已经解码的块中所使用的相邻方向来预测方向本身。
14、图1b示出了描述了根据jem的65种帧内预测方向,以说明预测方向的数量随时间增加的示意图(105)。
15、编码视频比特流中表示方向的帧内预测比特的映射可以因视频编码技术的不同而不同,并且,例如可以从对帧内预测模式的预测方向到码字的简单直接映射,到包括最可能的模式和类似技术的复杂自适应方案。然而,在所有情况下,视频内容中可能存在某些方向,其在统计学上比其它方向出现的概率更小。由于视频压缩的目的是减少冗余,所以在运行良好的视频编码技术中,与较为可能的方向相比,那些不太可能的方向将使用更多数量的比特来表示。
16、运动补偿可以是有损压缩技术,并且可以涉及如下技术:从先前已重建图片或其部分(参考图片)得到的样本数据块,在按照运动矢量(motion vector,mv)指示的方向上进行空间移位后,用于预测新重建的图片或图片部分。在一些情况下,参考图片可以与当前正在重建的图片相同。mv可以具有两个维度:x维度和y维度,或者具有三个维度,第三个维度用于指示使用中的参考图片(后者间接地可以是时间维度)。
17、在一些视频压缩技术中,可应用于某一样本数据区域的mv,可以根据其它mv预测得到,例如,根据在空间上与正在重建的区域相邻的另一样本数据区域相关的、解码顺序在所述mv之前的mv预测得到。这样做可以实质上减少对所述mv进行编码所需的数据量,从而消除冗余并增强压缩。mv预测可以有效地进行,例如,因为当对从摄像机导出的输入视频信号(称为自然视频)进行编码时,存在统计似然性,即,比单个mv可应用的区域大的多个区域,在相似方向上运动,因此,在一些情况下可以使用从相邻区域的多个mv导出的相似mv进行mv预测。这导致所找到的用于给定区域的mv,与从周围的mv预测得到的mv相似或相同,并且在熵编码之后,又可以用比直接对mv编码所用的比特数少的比特数来表示。在一些情况下,mv预测可以是对从原始信号(即:样本流)导出的信号(即:mv)的无损压缩的示例。在其它情况下,mv预测本身可以是有损的,例如,因为当从若干周围mv计算预测子时,会有舍入误差。
18、h.265/hevc(itu-t h.265建议书,“高效视频编码(high efficiency videocoding,hevc)”,2016年12月)中描述了各种mv预测机制。在h.265提供的多种mv预测机制中,本技术描述的是下文称作“空间合并”的技术。
19、请参考图1c,当前块(111)包括在运动搜索过程期间已由编码器发现的样本,根据已产生空间偏移的相同大小的先前块,可预测所述样本。另外,可从一个或多个参考图片相关联的元数据中导出所述mv,而非对mv直接编码。例如,使用关联于a0、a1和b0、b1、b2(分别对应112到116)五个周围样本中的任一样本的mv,(按解码次序)从最近的参考图片的元数据中导出所述mv。在h.265中,mv预测可使用相邻块也正在使用的相同参考图片的预测值。
技术实现思路
1、本技术实施例提供了一种视频解码方法,用于解码编码视频序列,所述方法包括:
2、对作为编码视频序列一部分的当前图片中当前块的预测信息进行解码,所述预测信息包括第一语法元素qp_delta_info_in_ph_flag,所述第一语法元素指示所述当前块的亮度分量的量化参数(qp)偏移信息和色度分量的qp偏移信息是否都包括在所述当前图片的图片头中;
3、其中,当所述第一语法元素取值等于1时,确定所述亮度分量的qp偏移信息和所述色度分量的qp偏移信息包括在所述当前图片的图片头中,当所述第一语法元素取值等于0时,确定所述亮度分量的qp偏移信息和所述色度分量的qp偏移信息不包括在所述当前图片的图片头中;基于所述色度分量的qp偏移信息确定色度分量的qp;以及基于所述色度分量的qp重建所述当前块。
4、在一些实施例中,本技术实施例还提供一种视频解码装置,用于解码编码视频序列,所述视频解码装置包括处理电路,所述处理电路被配置为:
5、对作为编码视频序列一部分的当前图片中当前块的预测信息进行解码,所述预测信息包括第一语法元素qp_delta_info_in_ph_flag,,所述第一语法元素指示所述当前块的亮度分量的量化参数qp偏移信息和色度分量的qp偏移信息是否都包括在所述当前图片的图片头中;
6、其中,当所述第一语法元素取值等于1时,确定所述亮度分量的qp偏移信息和所述色度分量的qp偏移信息包括在所述当前图片的图片头中,当所述第一语法元素取值等于0时,确定所述亮度分量的qp偏移信息和所述色度分量的qp偏移信息不包括在所述当前图片的图片头中;基于所述色度分量的qp偏移信息确定色度分量的qp;以及基于所述色度分量的qp重建所述当前块。
7、在一些实施例中,本技术实施例还提供一种视频编码方法,用于产生编码视频序列,所述方法包括:
8、对作为待编码视频序列一部分的当前图片中当前块的预测信息进行编码,所述预测信息包括第一语法元素qp_delta_info_in_ph_flag,所述第一语法元素指示所述当前块的亮度分量的量化参数(qp)偏移信息和色度分量的qp偏移信息是否都包括在所述当前图片的图片头中;
9、其中,当所述第一语法元素取值等于1时,确定所述亮度分量的qp偏移信息和所述色度分量的qp偏移信息包括在所述当前图片的图片头中,当所述第一语法元素取值等于0时,确定所述亮度分量的qp偏移信息和所述色度分量的qp偏移信息不包括在所述当前图片的图片头中;基于所述色度分量的qp偏移信息确定色度分量的qp;以及基于所述色度分量的qp编码所述当前块。
10、在一些实施例中,本技术实施例还提供一种视频编码装置,用于产生编码视频序列,所述视频编码装置包括处理电路,所述处理电路被配置为:
11、对作为待编码视频序列一部分的当前图片中当前块的预测信息进行编码,所述预测信息包括第一语法元素qp_delta_info_in_ph_flag,所述第一语法元素指示所述当前块的亮度分量的量化参数(qp)偏移信息和色度分量的qp偏移信息是否都包括在所述当前图片的图片头中;
12、其中,当所述第一语法元素取值等于1时,确定所述亮度分量的qp偏移信息和所述色度分量的qp偏移信息包括在所述当前图片的图片头中,当所述第一语法元素取值等于0时,确定所述亮度分量的qp偏移信息和所述色度分量的qp偏移信息不包括在所述当前图片的图片头中;基于所述色度分量的qp偏移信息确定色度分量的qp;以及基于所述色度分量的qp编码所述当前块。
13、在一些实施例中,本技术实施例还提供一种非临时性计算机可读存储介质,存储有指令,所述指令可以被至少一个处理器执行以执行如本技术实施例所述的视频解码方法,或者本技术实施例所述的视频编码方法。
14、本技术实施例还提供一种存储码流的方法,所述方法包括:在非临时性计算机可读存储介质上存储视频码流,基于本技术实施例所述的视频解码方法对所述视频码流进行解码,或者所述视频码流是根据本技术实施例所述的视频编码方法产生的。
本文地址:https://www.jishuxx.com/zhuanli/20240905/287004.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表