一种基于上下文渐进式三平面编码图像压缩算法及终端设备
- 国知局
- 2024-08-02 12:42:46
本发明属于图像处理,具体涉及一种基于上下文渐进式三平面编码图像压缩算法及终端设备。
背景技术:
1、图像压缩算法是用于降低数字图像文件大小的一系列技术,目的是在尽可能不损失图像质量的前提下减少存储空间和传输带宽的需求。其包括无损压缩和有损压缩两种主要方法。无损压缩算法允许原始图像数据的完整恢复,适用于对图像质量要求极高的场景。而有损压缩则通过舍弃一些视觉上不那么敏感的信息来获得更高的压缩率,广泛用于需要存储和传输大量图像数据的应用中。随着深度学习和人工智能技术的发展,图像压缩领域正在迎来基于上下文的编码、生成对抗网络和端到端学习等新兴技术,这些进步为提高压缩效率和图像质量提供了新的可能。
2、图像压缩算法的核心问题在于平衡压缩效率和图像质量的矛盾,以及在减少数据量的同时尽量保留原始信息的挑战。高效的压缩往往伴随着一定程度的数据丢失,这在有损压缩中尤为明显。同时,压缩过程中复杂的算法设计可能导致编解码耗时增加,对实时处理和资源受限设备构成挑战。针对这些问题,更紧凑的渐进式编码方案被提出,旨在通过智能编码步骤逐步精炼压缩过程,从而在保持图像质量的同时实现更高的压缩比,为图像压缩技术的进步开辟了新路径。
技术实现思路
1、本发明的目的在于提供一种基于上下文渐进式三平面编码图像压缩算法及终端设备,通过结合上下文信息,能够更精确地预测三阶概率,从而实现更为紧凑的编码。不仅提高了压缩效率,还有助于保留更丰富的图像细节。此外,算法还包含一个失真降低模块,可以智能地从三平面中提取关键张量信息,进一步减少了压缩过程中的图像质量损失。这使得在保持高质量图像重建的同时,实现了更高水平的压缩性能,克服了传统三平面编码与自回归上下文模型不兼容的问题。
2、为实现上述目的,本发明一种基于上下文渐进式三平面编码图像压缩算法,包括以下步骤:
3、s1、采用mpeg算法对原始视频流进行压缩,并获取其编码为h265格式的可视图像;
4、s2、通过编码器和超编码器依次将可视图像x转换为潜在张量y和超潜在张量z,此外使用量子化的、超解码器得到表示y的平均值和标准差;
5、s3、通过概率计算模块使用平均值、标准差和已编码的三平面来评估值;
6、s4、设计一个基于上下文的速率降低模块(rate reduction model,rrm),预测每个三平面的值并通过残差块和卷积层进行融合,最后使用激活函数确定值;
7、s5、设计一个基于上下文的失真降低模块(distortion reduction model,drm),在熵解码之后使用偏隐张量对任意范围内的值进行图像重构;
8、s6、最后,通过超解码器将改进的潜在张量进行图像重建。
9、作为本发明进一步的方案:所述s1包括以下步骤:
10、采用mpeg视频流图像压缩算法,通过运动补偿、离散余弦变换(dct)和哈夫曼编码技术,实现了高压缩比和低比特率下的良好视频质量,尤其擅长处理运动场景和减少时间冗余;此外,弥补了其他系列算法在动态视频压缩效率及带宽适应性方面的不足,提供了更加灵活和高效的视频传输解决方案。
11、作为本发明进一步的方案:所述s2包括以下步骤:
12、其中,编码器通过提取图像中的关键特征,使用卷积神经网络层层递进的提取图像特征,最终输出潜在张量y;超编码器进一步提炼和抽象化特征,进一步压缩信息等得到超潜在张量z;
13、此外,通过计算得出量子化的超潜在张量,如公式(1)示,随后使用超解码器得到平均值m和标准差,
14、 (1);
15、作为本发明进一步的方案:所述s3包括以下步骤:
16、通过概率计算模块使用平均值、标准差和已编码的三平面得到,其中,c代表通道数、h和w分别代表高度和宽度;
17、使用熵参数m和标准差,以及编码的三面值用以评估,其中熵参数通常用于调整和控制编码过程中的信息熵,从而影响压缩率的信息损失。
18、作为本发明进一步的方案:所述s4包括以下步骤:
19、通过设计一个基于上下文的速率降低模块(rate reduction model,rrm),摒弃按照栅格扫描顺序预测潜在元素,而是预测每个平面的,,此外,rrm模块对中的概率估计进行细化,以产生更新的张量,在熵编码过程中需要的比特比少,从而提高了“速率-失真”rd的性能。
20、如图2中所示,rrm分别从输入和上下文中提取特征,并通过残差块卷积层对它们进行融合,其中,融合张量具有与相同的空间分辨率,但是通道是的四倍,其按通道分为一个可加项和一个标度项;
21、首先,s被转换为b,如公式2示:
22、 (2);
23、具体来说,其每个元素都在中,然后将添加到中,并将其和通过b调制以产生更新的概率张量。
24、作为本发明进一步的方案:所述s5包括以下步骤:
25、不同与其他上下文模型都是在熵编码之前使用的,本文设计一个基于上下文的失真降低模块(distortion reduction model,drm),它是在熵解码后使用,与非渐进性编码器不同,本文提出的算法可以使用偏隐张量,对于任意,重构图像,因此,在解码之后,drm模块使用上下文来减少误差,从而减少图像失真。
26、如图3中所示,显示了drm的体系结构,以m和为上下文,drm模块将偏移张量化为,如公式(3)示:
27、 (3);
28、与rrm不同,drm不使用和作为上下文,因其包含关于的概率信息,由于已经被解码并用于重建,和几乎没有提供中未包含的额外信息,另外,drm模块是用于减少失真的回归器,而rrm是用于降低比特率的分类器。
29、drm模块经过训练,可以将损耗将至最低,如公式(4)所示:
30、 (4);
31、作为本发明进一步的方案:所述s6包括以下步骤:
32、最后,通过超解码器将改进的潜在张量进行图像重建得到。
33、为实现上述目的,本发明另一方面提供一种终端设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的程序或指令;所述处理器执行所述程序或指令时实现上述图像压缩算法。
34、与现有技术相比,本发明的有益效果如下:
35、上下文信息整合:通过开发一个基于上下文的概率降低模块,算法能够更准确地预测并估计潜在元素的三次概率;这种上下文信息的整合,为三个平面的数据提供了更为精确的编码基础,使得编码过程更加高效与紧凑。
36、智能张量提取:通过设计一个基于上下文的失真降低模块,该模块能够智能地从三平面中识别并提取关键的潜在张量信息;这一过程不仅优化了数据压缩效率,还显著提升了重建图像的质量,确保了压缩过程中图像细节的最大程度保留。
37、算法的改进为深度渐进图像压缩领域带来了新的性能提升,特别适用于对压缩效率和图像质量均有高要求的应用场景。
本文地址:https://www.jishuxx.com/zhuanli/20240802/237472.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。