技术新讯 > 电子通信装置的制造及其应用技术 > 一种基于深度学习的图像压缩方法及系统  >  正文

一种基于深度学习的图像压缩方法及系统

  • 国知局
  • 2024-10-09 16:19:42

本申请涉及图像处理,尤其涉及一种基于深度学习的图像压缩方法及系统。

背景技术:

1、在人类生活的城市区域,无线基站已经广泛部署,支持通过4g/5g等高速、大容量、高覆盖率的技术进行数据传输。这些技术极大地便利了人们的日常生活和各行各业的运作。然而,尽管地面网络覆盖广泛,地球上仍有许多地方由于地理环境的限制,如丛山峻岭、沙漠、草原等,无法部署基站以实现无线通信。为了解决这些区域的通信问题,卫星通信技术显得尤为重要。窄带卫星技术能够提供更加广泛的连接覆盖范围,不受地面环境限制,使得即使在偏远地区或地面网络难以覆盖的地方也能实现通信。在现有的卫星图像传输技术中,主要采用了多种方法。首先,传统的图像压缩算法如jpeg被广泛应用,它们通过对图像进行压缩和文件分割,以分包传输的方式实现图像的传输。其次,jpeg2000等渐进式图像传输技术也被采用,这些技术首先对图片进行图像处理、小波变换和深度压缩,然后再传输压缩后的数据。在现有的卫星图像输出技术中,终端采用的都是上述传统图像压缩算法,为了让图像能在卫星窄带中传输,需要对图形进行深度压缩,这会导致图像信息的丢失,解码后得到的图像往往存在模糊、失真的情况。

技术实现思路

1、为此,本申请的实施例提供了一种基于深度学习的图像压缩方法及系统,可以减少解码图像模糊失真的程度,提高解码后图像的清晰度。

2、第一方面,本申请提供一种基于深度学习的图像压缩方法。

3、本申请是通过以下技术方案得以实现的:

4、一种基于深度学习的图像压缩方法,所述图像压缩方法包括:

5、获取待深度压缩的目标图像;

6、利用图像压缩模型的编码器和通道自回归熵模型对所述目标图像进行编码,得到所述目标图像的编码文件;

7、将所述编码文件分解为若干数据流,并通过天通卫星发送至服务器;

8、服务器接收到所述编码文件,通过图像压缩模型的解码器和通道自回归熵模型对所述编码文件进行解码,得到所述目标图像的复原图像。

9、在本申请一较佳的示例中可以进一步设置为,所述利用图像压缩模型的编码器和通道自回归熵模型对所述目标图像进行编码,得到所述目标图像的编码文件的步骤为:

10、将目标图像输入到图像压缩模型中,利用编码器对所述目标图像依次进行两次5×5的卷积下采样、一次特征提取、两次5×5的卷积下采样、一次特征提取得到目标图像的潜在输出y;将所述潜在输出y输入到通道自回归熵模型得到潜在输出y的估计分布,对潜在输出进行量化得到期望输出通过算术编码将所述期望输出转化为比特流,形成二进制形式的编码文件。

11、在本申请一较佳的示例中可以进一步设置为,所述服务器接收到所述编码文件,通过图像压缩模型的解码器和通道自回归熵模型对所述编码文件进行解码,得到所述目标图像的复原图像的步骤包括:

12、对编码文件进行算术解码得到期望输出通道自回归熵模型利用潜在输出y和期望输出之间的误差与期望输出得到解码器的输入变量解码器对所述输入变量依次进行一次提取特征、两次5×5卷积上采样、一次提取特征、两次5×5卷积上采样,输出目标图像对应的复原图像。

13、在本申请一较佳的示例中可以进一步设置为,所述图像压缩模型的损失函数设置为:

14、

15、其中,表示损失函数,表示随机变量x根据分布px计算期望值,表示用生成的估计分布,表示的估计分布,λ表示控制速率和失真之间的权衡参数,r表示潜在输出和辅助信息的比特率;表示原始图像x和复原图像之间的失真,表示期望输出,即潜在输出的量化信息,表示辅助信息的量化信息。

16、在本申请一较佳的示例中可以进一步设置为,将所述潜在输出y输入到通道自回归熵模型得到潜在输出y的估计分布的步骤中包括:

17、通道自回归熵模型的切片数量设置为10个切片。

18、在本申请一较佳的示例中可以进一步设置为,编码过程或解码过程中通过dw-wam模块进行特征提取。

19、在本申请一较佳的示例中可以进一步设置为,所述dw-wam模块包括两个分支,其中第一分支包括三个深度卷积残差块,第二分支包括windows attention module块,三个深度卷积残差块,一个1×1卷积块和sigmoid激活函数;两个分支的输出端通过残差连接。

20、第二方面,本申请提供一种基于深度学习的图像压缩系统。

21、本申请是通过以下技术方案得以实现的:

22、一种基于深度学习的图像压缩系统,所述图像压缩系统包括:

23、图像获取模块,用于获取待深度压缩的目标图像;

24、图像编码模块,用于利用图像压缩模型的编码器和通道自回归熵模型对所述目标图像进行编码,得到所述目标图像的编码文件;

25、图像传输模块,用于将所述编码文件分解为若干数据流,并通过天通卫星发送至服务器;

26、图像解码模块,用于通过图像压缩模型的解码器和通道自回归熵模型对所述编码文件进行解码,得到所述目标图像的复原图像。

27、在本申请一较佳的示例中可以进一步设置为,所述图像压缩模型包括编码器、通道自回归熵模型和解码器;所述编码器的输入端为目标图像,所述编码器的输出端连接通道自回归熵模型的输入端,所述通道自回归熵模型的输出端连接解码器的输入端,所述解码器的输出端为目标图像的复原图像。

28、在本申请一较佳的示例中可以进一步设置为,在所述编码器和解码器中均包括特征提取单元;所述特征提取单元为dw-wam模块。

29、综上所述,与现有技术相比,本申请实施例提供的技术方案带来的有益效果至少包括:

30、本申请首先获取待深度压缩的目标图像;利用图像压缩模型的编码器对目标图像进行编码,得到目标图像的编码文件;将编码文件分解为若干数据流,并通过天通卫星发送至服务器;服务器接收到编码文件,通过图像压缩模型的解码器对编码文件进行解码,得到目标图像的复原图像。本申请提出的图像压缩方法使用的图像压缩模型既能关注图像局部特征,又能关注到图像的全局特征,能够全面理解图像的内容,通过窄带卫星传输的深度压缩图像也能更好的解码复原,减少解码图像模糊失真的程度,提高用户的体验感。

技术特征:

1.一种基于深度学习的图像压缩方法,其特征在于,所述图像压缩方法包括:

2.根据权利要求1所述的基于深度学习的图像压缩方法,其特征在于,所述利用图像压缩模型的编码器和通道自回归熵模型对所述目标图像进行编码,得到所述目标图像的编码文件的步骤为:

3.根据权利要求2所述的基于深度学习的图像压缩方法,其特征在于,所述服务器接收到所述编码文件,通过图像压缩模型的解码器和通道自回归熵模型对所述编码文件进行解码,得到所述目标图像的复原图像的步骤包括:

4.根据权利要求1所述的基于深度学习的图像压缩方法,其特征在于,所述图像压缩模型的损失函数设置为:

5.根据权利要求2所述的基于深度学习的图像压缩方法,其特征在于,将所述潜在输出y输入到通道自回归熵模型得到潜在输出y的估计分布的步骤中包括:

6.根据权利要求2或3所述的基于深度学习的图像压缩方法,其特征在于,编码过程或解码过程中通过dw-wam模块进行特征提取。

7.根据权利要求6所述的基于深度学习的图像压缩方法,其特征在于,所述dw-wam模块包括两个分支,其中第一分支包括三个深度卷积残差块,第二分支包括windows attentionmodule块,三个深度卷积残差块,一个1×1卷积块和sigmoid激活函数;两个分支的输出端通过残差连接。

8.一种基于深度学习的图像压缩系统,其特征在于,所述图像压缩系统包括:

9.根据权利要求8所述的基于深度学习的图像压缩系统,其特征在于,所述图像压缩模型包括编码器、通道自回归熵模型和解码器;所述编码器的输入端为目标图像,所述编码器的输出端连接通道自回归熵模型的输入端,所述通道自回归熵模型的输出端连接解码器的输入端,所述解码器的输出端为目标图像的复原图像。

10.根据权利要求8所述的基于深度学习的图像压缩系统,其特征在于,在所述编码器和解码器中均包括特征提取单元;所述特征提取单元为dw-wam模块。

技术总结本申请公开了一种基于深度学习的图像压缩方法及系统。通过获取待深度压缩的目标图像;利用图像压缩模型的编码器对目标图像进行编码,得到目标图像的编码文件;将编码文件分解为若干数据流,并通过天通卫星发送至服务器;服务器接收到编码文件,通过图像压缩模型的解码器对编码文件进行解码,得到目标图像的复原图像。本申请提出的图像压缩方法使用的图像压缩模型既能关注图像局部特征,又能关注到图像的全局特征,能够让深度压缩图像也能更好的解码复原,减少解码图像模糊失真的程度,提高用户的体验感。技术研发人员:朱祥维,廖冠中,许倩瑶,李凯瑶,彭丁卫受保护的技术使用者:中山大学技术研发日:技术公布日:2024/9/26

本文地址:https://www.jishuxx.com/zhuanli/20240929/312679.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。