技术新讯 > 电子通信装置的制造及其应用技术 > 一种基于多参考熵模型的图像压缩方法  >  正文

一种基于多参考熵模型的图像压缩方法

  • 国知局
  • 2024-08-02 14:50:39

本发明公开一种基于多参考熵模型的图像压缩方法,属于图像处理。

背景技术:

1、图像压缩作为多媒体信号处理领域的一个核心研究主题,长期以来受到了广泛关注。它旨在通过降低图像中的空间、视觉以及统计上的冗余,实现图像数据的高效紧凑表示。尽管传统的编码技术,如jpeg、jpeg2000、bpg和vvc等,已经在性能上取得了显著的成果,但这些方法多依赖于手工设计的模块,且各模块之间相互独立,这种缺乏联合优化的方式限制了它们进一步挖掘图像压缩潜力的能力。尽管当前的图像压缩方法在技术上取得了突破,它们在图像重建质量与解码速度之间的平衡仍然面临挑战。

技术实现思路

1、本发明的目的在于提供一种基于多参考熵模型的图像压缩方法,以解决现有技术中,图像压缩速度慢、精度低的问题。

2、一种基于多参考熵模型的图像压缩方法,包括:

3、s1获取待压缩图像送入分析变换网络,对进行分析变换,提取潜在特征;

4、s2将送入超分析变换网络,对进行超分析变换,获取超先验 z,对 z进行算数编码,得到超先验码流;

5、s3构建多参考熵模型,估计的概率分布,对进行算术编码,得到潜在表示码流;

6、s4对超先验码流进行算数解码,得到重建的超先验 z’,并对 z’进行超先验综合变换;

7、s5基于多参考熵模型,对潜在表示码流进行解码,得到重建的潜在特征;

8、s6对进行综合变换,得到重建的图像,完成图像压缩;

9、s7构建基于率失真优化目标的图像压缩损失函数 l,进行端到端网络训练优化;

10、;

11、式中,是比特率,是拉格朗日乘子,是失真。

12、分析变换网络包括三个连续的下采样模块与特征提取块;

13、下采样模块中,通过残差连接依次对卷积块、relu激活函数、卷积块、广义分裂归一化层进行连接,得到2倍下采样后的;

14、特征提取块包括双分路的swin-transformer块和卷积块,基于swin-transformer的特征提取块提取局部和全局特征,融合后得到特征融合的;

15、经过三次连续的下采样模块与特征提取块后,得到6倍下采样后的。

16、s2包括,超分析变换网络包括下采样模块、特征提取块和卷积块,获取 z后,对 z进行量化进一步减少信息量,经过基于因式分解的算数编码得到超先验码流。

17、s3包括,多参考熵模型包括通道上下文模块、组间全局空间上下文模块、组内空间上下文模块和超先验模块;

18、调用通道上下文模块,将基于不均匀的通道组进行划分,使用hiera-transformer特征提取模块在通道维度进行通道上下文的提取;

19、调用组间全局空间上下文模块,使用swin-transformer全局特征提取块在空间维度上进行组间空间全局上下文的提取;

20、调用组内空间上下文模块,基于棋盘格机制,将组内划分为两部分,使用双分路的卷积特征提取块和hiera-transformer特征提取模块在空间维度上进行组内局部和全局空间上下文的提取。

21、s4包括,使用基于因式分解的算数解码,将超先验码流解码;超先验综合变换使用超先验综合变换模块,超先验综合变换模块包括上采样模块、swin-transformer特征提取块和卷积块。

22、s6包括,综合变换使用综合变换网络,综合变换网络包括三个连续的上采样模块和基于swin-transformer注意力机制的特征提取块;

23、上采样模块包括卷积块、relu激活函数、卷积块和广义分裂归一化层,得到2倍上采样后的;

24、基于swin-transformer注意力机制的特征提取块包括swin-transformer块、卷积块和rulu激活函数;

25、经过三次连续的上采样模块与基于swin-transformer注意力机制的特征提取块后,得到6倍上采样后的结果。

26、相对比现有技术,本发明具有以下有益效果:本发明有助于获取更低比特率的潜在特征,实现更高效的数据编码,能够显著减少所需的比特数,进而提高压缩效率,实现了在重建质量和编解码速度之间更好的权衡。

技术特征:

1.一种基于多参考熵模型的图像压缩方法,其特征在于,包括:

2.根据权利要求1所述的一种基于多参考熵模型的图像压缩方法,其特征在于,分析变换网络包括三个连续的下采样模块与特征提取块;

3.根据权利要求2所述的一种基于多参考熵模型的图像压缩方法,其特征在于,s2包括,超分析变换网络包括下采样模块、特征提取块和卷积块,获取z后,对z进行量化进一步减少信息量,经过基于因式分解的算数编码得到超先验码流。

4.根据权利要求3所述的一种基于多参考熵模型的图像压缩方法,其特征在于,s3包括,多参考熵模型包括通道上下文模块、组间全局空间上下文模块、组内空间上下文模块和超先验模块;

5.根据权利要求4所述的一种基于多参考熵模型的图像压缩方法,其特征在于,s4包括,使用基于因式分解的算数解码,将超先验码流解码;超先验综合变换使用超先验综合变换模块,超先验综合变换模块包括上采样模块、swin-transformer特征提取块和卷积块。

6.根据权利要求5所述的一种基于多参考熵模型的图像压缩方法,其特征在于,s6包括,综合变换使用综合变换网络,综合变换网络包括三个连续的上采样模块和基于swin-transformer注意力机制的特征提取块;

技术总结本发明公开一种基于多参考熵模型的图像压缩方法,属于图像处理技术领域,用于图像压缩,包括获取待压缩图像对其进行分析变换,提取潜在特征表示,对潜在特征表示进行超分析变换,获取超先验表示进行算数编码,得到超先验码流;构建多参考熵模型,估计潜在特征的概率分布,对潜在特征进行算术编码,得到潜在表示码流;对超先验码流进行算数解码,得到重建超先验表示,进行超先验综合变换;基于多参考熵模型,对潜在表示码流进行解码,得到重建潜在表示;对重建潜在特征表示进行综合变换,得到重建图像。本发明实现更高效的数据编码,在重建质量和编解码速度之间获得更好的权衡。技术研发人员:张千,邵明文,李慧金,梁鸿,刘建航,王风华,钟敏受保护的技术使用者:中国石油大学(华东)技术研发日:技术公布日:2024/7/29

本文地址:https://www.jishuxx.com/zhuanli/20240801/244054.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。