使用预测感知灵活跳过译码来对视频内容进行编码和解码的制作方法
- 国知局
- 2024-08-02 14:54:38
本公开整体涉及视频内容编码和解码。
背景技术:
1、计算机系统可用于对视频内容进行编码和解码。作为示例,第一计算机系统可获得视频内容,以压缩的数据格式对该视频内容进行编码,并且将经编码的数据提供给第二计算机系统。第二计算机系统可对经编码的数据进行解码,并且基于经解码的数据来生成视频内容的视觉表示。
技术实现思路
1、在一个方面,一种方法包括:由解码器获得表示视频内容的数据流,其中该视频内容被分区成一个或多个逻辑单元,并且其中这些逻辑单元中的每一者被分区成一个或多个相应逻辑子单元;由该解码器确定该数据流包括第一数据,该第一数据指示已经根据灵活跳过译码方案来对第一逻辑单元进行编码;以及响应于确定该数据流包括该第一数据:基于该第一数据来确定第一组解码参数,以及根据该第一组解码参数来对该第一逻辑单元的这些逻辑子单元中的每一者进行解码。
2、该方面的具体实施可包括以下特征中的一者或多者。
3、在一些具体实施中,该方法还可包括:由该解码器确定该数据流包括第二数据,该第二数据指示已经根据该灵活跳过译码方案来对多个第二逻辑单元进行编码;以及响应于确定该数据流包括该第二数据:基于该第二数据来确定第二组解码参数,以及根据该第二组解码参数来对该第二逻辑单元的这些逻辑子单元中的每一者进行解码。
4、在一些具体实施中,该一个或多个逻辑单元中的每一者可以是以下中的一者或多者:该视频内容的译码块、该视频内容的宏块、该视频内容的预测单元、该视频内容的译码树单元、该视频内容的超级块、该视频内容的切片、该视频内容的图块、该视频内容的片段或该视频内容的图片。
5、在一些具体实施中,该一个或多个逻辑子单元中的每一者可以是该视频内容的变换单元。
6、在一些具体实施中,该第一数据可指示已经根据该灵活跳过译码方案来对该第一逻辑单元的一个或多个指定颜色分量进行编码。根据该第一组解码参数来对该第一逻辑单元的这些逻辑子单元中的每一者进行解码可包括根据该第一组解码参数来对该第一逻辑单元的该逻辑子单元的该一个或多个指定颜色分量进行解码。
7、在一些具体实施中,该一个或多个指定颜色分量可包括以下中的至少一者:亮度分量或色度分量。
8、在一些具体实施中,该第一组参数可包括以下中的至少一者:与该第一逻辑单元的这些逻辑子单元中的每一者相关联的公共变换类型、与该第一逻辑单元的这些逻辑子单元中的每一者相关联的公共变换系数扫描次序类型、与该第一逻辑单元的这些逻辑子单元中的每一者相关联的公共变换系数扫描方向、与该第一逻辑单元的这些逻辑子单元中的每一者相关联的公共变换系数译码上下文方案、或与该第一逻辑单元的这些逻辑子单元中的每一者相关联的公共变换大小。
9、在一些具体实施中,该公共变换类型可以是以下中的一者或多者:恒等变换类型、离散余弦变换类型或非对称离散正弦变换类型、或学习型变换(learned transform)类型。
10、在一些具体实施中,该公共变换系数扫描次序类型可对应于用于对关于一个或多个变换系数的级别信息进行编码的正向变换系数扫描次序。
11、在一些具体实施中,该公共变换系数扫描方向可以是以下中的一者:正向右上对角线扫描、正向右下对角线扫描、正向z字形扫描方向、正向对角线扫描方向、正向水平扫描方向或正向竖直扫描方向。
12、在一些具体实施中,该公共变换系数扫描次序类型可对应于用于对关于一个或多个变换系数的正负号信息进行编码的逆向变换系数扫描次序。
13、在一些具体实施中,这些逻辑子单元中的每一者可包括多个区域,每个区域具有相应索引值和相应级别值。根据该公共变换系数译码上下文方案,可通过以下步骤来确定用于特定区域的变换系数译码上下文:识别该逻辑子单元的一个或多个其他区域,该一个或多个其他区域具有小于此区域的索引值的索引值,以及确定所识别的一个或多个其他区域中的每一者的该级别值。
14、在一些具体实施中,根据该公共变换系数译码上下文方案,可通过以下步骤来进一步确定用于特定区域的该变换系数译码上下文:确定所识别的一个或多个其他区域中的每一者的该级别值的总和,以及基于该总和来选择用于此区域的该变换系数译码上下文。
15、在一些具体实施中,这些逻辑子单元中的每一者可包括根据二维布置的多个区域,每个区域具有相应级别值。根据该公共变换系数译码上下文方案,可通过以下步骤来确定用于特定区域的变换系数译码上下文:识别该二维网格中该逻辑子单元的与此区域相邻的一个或多个其他区域,以及确定所识别的一个或多个其他区域中的每一者的该级别值的正负号。
16、在一些具体实施中,根据该公共变换系数译码上下文方案,可通过以下步骤来进一步确定用于特定区域的该变换系数译码上下文:基于该正负号来选择用于此区域的该变换系数译码上下文。
17、在一些具体实施中,识别该二维网格中该逻辑子单元的与此区域相邻的该一个或多个其他区域可包括:识别该二维网格中此区域右侧的第一区域,以及识别该二维网格中此区域下方的第二区域。
18、在一些具体实施中,这些逻辑子单元中的每一者可包括根据二维布置的多个区域,每个区域具有相应级别值。根据该公共变换系数译码上下文方案,可通过以下步骤来确定用于特定区域的变换系数译码上下文:识别该二维网格中该逻辑子单元的与此区域相邻的一个或多个其他区域,以及确定所识别的一个或多个其他区域中的每一者的该级别值。
19、在一些具体实施中,根据该公共变换系数译码上下文方案,可通过以下步骤来进一步确定用于特定区域的该变换系数译码上下文:基于该正负号来选择用于此区域的该变换系数译码上下文。
20、在一些具体实施中,识别该二维网格中该逻辑子单元的与此区域相邻的该一个或多个其他区域可包括:识别该二维网格中此区域上方的第一区域,以及识别该二维网格中此区域左侧的第二区域。
21、在一些具体实施中,该第一组参数可包括以下中的至少一者:与该第一逻辑单元的这些逻辑子单元中的每一者相关联的公共帧内预测模式、与该第一逻辑单元的这些逻辑子单元中的每一者相关联的公共帧间预测模式、或与该第一逻辑单元的这些逻辑子单元中的每一者相关联的公共逻辑子单元大小。
22、在一些具体实施中,该第一组参数可指定根据以下方面来对该第一逻辑单元的这些逻辑子单元中的每一者进行解码:多参考线(mrl)预测、调色板模式、辅助变换、滤波器帧内模式、基于偏移的细化帧内预测(orip)或奇偶隐藏模式。
23、在一些具体实施中,该辅助变换可以是低频不可分离变换。
24、在一些具体实施中,该第一组参数可包括:与该第一逻辑单元的这些逻辑子单元中的每一者相关联的角度增量值。
25、在一些具体实施中,该第一组参数可指定该数据流不包括用于该第一逻辑单元的该逻辑子单元中的任一者的最后变换系数位置信令。
26、在一些具体实施中,该方法还可包括:确定该数据流包括对该逻辑子单元中的一者的第一非零系数的指示;以及响应于确定该数据流包括对该逻辑子单元中的一者的该第一非零系数的该指示:禁止在该第一非零系数之前对此逻辑子单元的系数进行解码,以及从该第一非零系数开始顺序地对此逻辑子单元的系数进行解码。
27、在一些具体实施中,对该逻辑子单元中的一者的该第一非零系数的该指示可包括块语法的开始,其中块语法的该开始被定位在比特流中此逻辑子单元的该系数之前。
28、在另一个方面,一种方法包括:由解码器获得表示视频内容的数据流,其中该视频内容被分区成一个或多个逻辑单元,并且其中这些逻辑单元中的每一者被分区成一个或多个相应逻辑子单元;由该解码器确定该数据流包括:帧间译码块和/或帧内块复制块,以及对与该帧间译码块和/或该帧内块复制块相关联的变换类型的指示,其中该变换类型是以下中的一者:恒等变换类型、离散余弦变换类型或非对称离散正弦变换类型;以及响应于确定该数据流包括(i)该帧间译码块和/或该帧内块复制块以及(ii)对与该帧间译码块和/或该帧内块复制块相关联的该变换类型的该指示:确定第一组解码参数,以及根据该第一组解码参数来对该第一逻辑单元的这些逻辑子单元中的每一者进行解码。
29、其他具体实施涉及其上存储有指令的系统、设备和非暂态计算机可读介质,这些指令当由一个或多个处理器执行时使该一个或多个处理器执行本文所述的操作。
30、在下面的附图和具体实施方式中阐述了一个或多个实施方案的细节。其他特征和优点将在具体实施方式和附图以及权利要求中显而易见。
本文地址:https://www.jishuxx.com/zhuanli/20240801/244293.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表