用于图像编码/解码的方法、设备和记录介质与流程
- 国知局
- 2024-08-30 15:03:20
本公开涉及用于图像编码/解码的方法、设备和存储介质。本申请要求于2021年11月17日提交的申请号为10-2021-0158574以及于2022年11月17日提交的申请号为10-2022-0154359的韩国专利申请的权益,所述韩国专利申请在此通过引用其全部而包含到本申请中。
背景技术:
1、随着信息与通信行业的持续发展,支持高清晰度(hd)分辨率的广播服务已经在全世界普及。通过这种普及,大量用户已经习惯了高分辨率和高清晰度图像和/或视频。
2、为了满足用户对高清晰度的需求,大量机构已加速了对下一代成像装置的开发。除了高清tv(hdtv)和全高清(fhd)tv之外,用户对uhd tv的兴趣也已增加,其中,uhd tv的分辨率是全高清(fhd)tv的分辨率的四倍以上。随着其兴趣的增加,现在需要针对具有更高分辨率和更高清晰度的图像的图像编码/解码技术。
3、作为图像压缩技术,存在各种技术(诸如帧间预测技术、帧内预测技术、变换、量化技术和熵编码技术)。
4、帧间预测技术是用于使用当前画面之前的画面和/或当前画面之后的画面来预测包括在当前画面中的像素的值的技术。帧内预测技术是用于使用关于当前画面中的像素的信息来预测当前画面中包括的像素的值的技术。变换和量化技术可以是用于压缩残差信号的能量的技术。熵编码技术是用于将短码字分配给频繁出现的值并将长码字分配给较不频繁出现的值的技术。
5、通过利用这些图像压缩技术,可有效地压缩、发送和存储关于图像的数据。
技术实现思路
1、技术问题
2、实施例旨在提供用于使用机器学习来确定预测信息的设备、方法和存储介质。
3、实施例旨在用于使用机器学习来确定帧内预测模式的设备、方法和存储介质。
4、技术方案
5、根据一方面,提供了一种图像解码方法,包括:导出目标块的帧内预测模式;配置用于帧内预测的参考样点;以及使用帧内预测模式和参考样点对目标块执行帧内预测。
6、帧内预测模式可以是包括帧内预测的预测模式。
7、帧内预测模式可以是位置相关帧内预测组合(pdpc)模式、跨分量线性模型(cclm)模式、帧内子分区(isp)模式、多参考线(mrl)模式、矩阵加权帧内预测(mip)模式、帧内块复制(ibc)模式或机器学习(ml)模式。
8、ml模式可包括基于机器学习的预测、预测样点混合、预测样点细化和预测样点缩放中的一个或更多个。
9、帧内预测模式可使用最可能模式(mpm)列表来被导出。
10、mpm列表可包括第一mpm列表和第二mpm列表。
11、第一mpm列表可包括使用机器学习的帧内预测模式。
12、第二mpm列表可包括不使用机器学习的帧内预测模式。
13、当配置mpm列表时,目标块的邻近块的帧内预测模式可被替换为附加帧内预测模式,并且替换的附加帧内预测模式可被添加到mpm列表。
14、帧内预测模式可使用基于机器学习的帧内预测模式导出方法来被导出。
15、基于机器学习的帧内预测模式导出方法可使用单层感知器(slp)、多层感知器(mlp)、深度神经网络(dnn)、卷积神经网络(cnn)和递归神经网络(rnn)中的一个或更多个来被执行。
16、基于机器学习的帧内预测模式导出方法的输出可包括一个或更多个帧内预测模式的一个或更多个概率。
17、参考样点可使用参考样点滤波来被配置。
18、参考样点可使用参考样点缩放来被配置。
19、帧内预测可使用基于机器学习的预测来被执行。
20、帧内预测可使用预测样点混合来被执行。
21、帧内预测可使用预测样点细化来被执行。
22、帧内预测模式可使用变换模式的概率来被导出。
23、帧内预测模式可使用变换模式集合的概率来被导出。
24、根据另一方面,提供了一种图像编码方法,包括:导出目标块的帧内预测模式;配置用于帧内预测的参考样点;以及使用帧内预测模式和参考样点对目标块执行帧内预测。
25、根据又一方面,提供了一种用于存储用于图像解码的比特流的计算机可读存储介质,其中,比特流包括编码的编码信息,编码信息是通过对编码的编码信息执行解码来生成的,目标块的帧内预测模式是使用编码信息导出的,用于帧内预测的参考样点被配置,并且对目标块的帧内预测使用帧内预测模式和参考样点来被执行。
26、有利效果
27、提供了用于使用机器学习来确定预测信息的设备、方法和存储介质。
28、在实施例中,提供了用于使用机器学习来确定帧内预测模式的设备、方法和存储介质。
技术特征:1.一种图像解码方法,包括:
2.根据权利要求1所述的图像解码方法,其中,帧内预测模式是包括帧内预测的预测模式。
3.根据权利要求2所述的图像解码方法,其中,帧内预测模式是位置相关帧内预测组合pdpc模式、跨分量线性模型cclm模式、帧内子分区isp模式、多参考线mrl模式、矩阵加权帧内预测mip模式、帧内块复制ibc模式或机器学习ml模式。
4.根据权利要求3所述的图像解码方法,其中,ml模式包括基于机器学习的预测、预测样点混合、预测样点细化和预测样点缩放中的一个或更多个。
5.根据权利要求1所述的图像解码方法,其中,帧内预测模式是使用最可能模式mpm列表导出的。
6.根据权利要求1所述的图像解码方法,其中,mpm列表包括第一mpm列表和第二mpm列表。
7.根据权利要求6所述的图像解码方法,其中:
8.根据权利要求7所述的图像解码方法,其中,当配置mpm列表时,目标块的邻近块的帧内预测模式被替换为附加帧内预测模式,并且替换的附加帧内预测模式被添加到mpm列表。
9.根据权利要求1所述的图像解码方法,其中,帧内预测模式是使用基于机器学习的帧内预测模式导出方法导出的。
10.根据权利要求9所述的图像解码方法,其中,基于机器学习的帧内预测模式导出方法使用单层感知器slp、多层感知器mlp、深度神经网络dnn、卷积神经网络cnn和递归神经网络rnn中的一个或更多个来被执行。
11.根据权利要求9所述的图像解码方法,其中,基于机器学习的帧内预测模式导出方法的输出包括一个或更多个帧内预测模式的一个或更多个概率。
12.根据权利要求1所述的图像解码方法,其中,参考样点使用参考样点滤波来被配置。
13.根据权利要求1所述的图像解码方法,其中,参考样点使用参考样点缩放来被配置。
14.根据权利要求1所述的图像解码方法,其中,帧内预测使用基于机器学习的预测来被执行。
15.根据权利要求1所述的图像解码方法,其中,帧内预测使用预测样点混合来被执行。
16.根据权利要求1所述的图像解码方法,其中,帧内预测使用预测样点细化来被执行。
17.根据权利要求1所述的图像解码方法,其中,帧内预测模式是使用变换模式的概率导出的。
18.根据权利要求1所述的图像解码方法,其中,帧内预测模式是使用变换模式集合的概率导出的。
19.一种图像编码方法,包括:
20.一种用于存储用于图像解码的比特流的计算机可读存储介质,其中:
技术总结本文公开了一种用于图像编码/解码的方法、设备和存储介质。在用于图像编码/解码方法中,导出目标块的帧内预测模式,并且配置用于帧内预测的参考样点。使用导出的帧内预测模式和配置的参考样点来执行对目标块的帧内预测。在导出帧内预测模式时,可使用基于机器学习的帧内预测模式导出方法。在帧内预测中,可使用基于机器学习的预测、预测样点混合、预测样点细化和预测样点缩放。技术研发人员:权亨晋,金东炫,金燕姬,金钟昊,都志勳,李珠荣,林雄,郑洗润,崔振秀,李泰辰,金在坤,林都铉,文纪化受保护的技术使用者:韩国电子通信研究院技术研发日:技术公布日:2024/8/27本文地址:https://www.jishuxx.com/zhuanli/20240830/285306.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
上一篇
电池通行证的制作方法
下一篇
返回列表