技术新讯 > 电子通信装置的制造及其应用技术 > 图像压缩方法、电子设备以及存储介质 > 正文

图像压缩方法、电子设备以及存储介质

国知局
2024-08-02 12:42:11

本发明涉及图像处理领域，特别涉及一种图像压缩方法、电子设备以及存储介质。

背景技术：

1、现有的图像压缩方法仅针对人眼视觉优化，而忽略了图像数据在机器视觉任务中的应用需求。

2、即压缩后的图像在视觉认知上的表现不错，但丢失了对机器视觉任务至关重要的信息；从而导致后续图像处理单元对压缩后的图像进行识别、分类等任务的性能下降。

技术实现思路

1、为解决上述问题，本发明提供了一种图像压缩方法，包括：

2、获取原始图像，所述原始图像输入主压缩分支；

3、编码器对所述原始图像进行编码生成第一图像数据；增益单元将所述第一图像数据进行动态调整再传输到量化模块；

4、所述第一图像数据经所述量化模块处理得到第二图像数据；所述第二图像数据经解码器处理生成第一输出图像；

5、所述第一图像数据和所述第二图像数据输入辅助压缩分支，所述辅助压缩分支基于所述第一图像数据和所述第二图像数据生成残差；

6、所述第一输出图像基于所述残差和残差值参数输出最终图像。

7、其中，所述第二图像数据经算术编码、算术解码和逆增益单元处理后再传输到所述解码器。

8、其中，所述辅助压缩分支包括可扩展变换模块和残差重建模块；所述可扩展变换模块基于所述第一图像数据和所述第二图像数据生成比特流；所述第一图像数据经量化处理后生成所述第二图像数据会产生量化误差；所述比特流传输所述量化误差；基于所述量化误差和所述第二图像数据生成第三图像数据；所述可扩展变换模块将所述第三图像数据传输到所述残差重建模块。

9、其中，所述可扩展变换模块包括辅助增益单元、辅助量化模块、算术编码、算术解码和逆辅助增益单元。

10、其中，所述残差重建模块基于所述第三图像数据恢复所述原始图像的残差信息；所述第一输出图像基于所述残差信息生成所述最终图像。

11、其中，所述图像压缩方法的训练包括所述主压缩分支训练和所述辅助压缩分支训练；所述主分支压缩训练时所述辅助压缩分支不训练；所述辅助压缩分支训练时所述主分支压缩不训练。

12、其中，所述主压缩分支训练采用认知导向损失函数，所述认知导向损失函数对所述增益单元、所述编码器和所述解码器的参数进行训练。所述主压缩分支基于认知导向损失函数训练；所述认知导向损失函数结合对比学习机制；所述认知导向损失函数训练包括：

13、优化正样本与负样本之间的特征表示距离；

14、计算所述最终图像与所述原始图像对应像素点的均方误差。

15、其中，所述辅助压缩分支训练通过调整辅助分支和增益单元的参数以提高所述最终图像的质量。

16、为解决上述问题，本发明还提供了一种电子设备，所述电子设备包括：相互耦接的存储器和处理器，所述处理器用于执行所述存储器中存储的程序指令，以实现上述任一项所述的图像压缩方法。

17、为解决上述问题，本发明还提供了一种计算机可读存储介质，所述计算机可读存储介质存储有程序数据，所述程序数据能够被处理器执行以实现上述任一项所述的图像压缩方法。

18、本发明的有益效果：区别于现有技术，本发明公开了一种图像压缩方法、电子设备以及存储介质；其中图像压缩方法包括：获取原始图像，原始图像输入主压缩分支；编码器对原始图像进行编码生成第一图像数据；增益单元将第一图像数据进行动态调整再传输到量化模块；第一图像数据经量化模块处理得到第二图像数据；第二图像数据经解码器处理生成第一输出图像；第一图像数据和第二图像数据输入辅助压缩分支，辅助压缩分支基于第一图像数据和第二图像数据生成残差；第一输出图像基于残差和残差值参数输出最终图像。通过上述方式，本发明通过辅助压缩分支提升输出最终图像的视觉质量，且通过调节残差值参数实现了最终图像在机器认知和人眼认知之间的平衡，提高适用性。

技术特征：

1.一种图像压缩方法，其特征在于，包括：

2.根据权利要求1所述的图像压缩方法，其特征在于，所述第二图像数据经算术编码、算术解码和逆增益单元处理后再传输到所述解码器。

3.根据权利要求2所述的图像压缩方法，其特征在于，所述辅助压缩分支包括可扩展变换模块和残差重建模块；所述可扩展变换模块基于所述第一图像数据和所述第二图像数据生成比特流；所述第一图像数据经量化处理后生成所述第二图像数据会产生量化误差；所述比特流传输所述量化误差；基于所述量化误差和所述第二图像数据生成第三图像数据；所述可扩展变换模块将所述第三图像数据传输到所述残差重建模块。

4.根据权利要求3所述的图像压缩方法，其特征在于，所述可扩展变换模块包括辅助增益单元、辅助量化模块、算术编码、算术解码和逆辅助增益单元。

5.根据权利要求4所述的图像压缩方法，其特征在于，所述残差重建模块基于所述第三图像数据恢复所述原始图像的残差信息；所述第一输出图像基于所述残差信息生成所述最终图像。

6.根据权利要求1-5任一项所述的图像压缩方法，其特征在于，所述图像压缩方法的训练包括所述主压缩分支训练和所述辅助压缩分支训练；所述主分支压缩训练时所述辅助压缩分支不训练；所述辅助压缩分支训练时所述主分支压缩不训练。

7.根据权利要求6所述的图像压缩方法，其特征在于，所述主压缩分支训练采用认知导向损失函数，所述认知导向损失函数对所述增益单元、所述编码器和所述解码器的参数进行训练。所述主压缩分支基于认知导向损失函数训练；所述认知导向损失函数结合对比学习机制；所述认知导向损失函数训练包括：

8.根据权利要求7所述的图像压缩方法，其特征在于，所述辅助压缩分支训练通过调整辅助分支和增益单元的参数以提高所述最终图像的质量。

9.一种电子设备，其特征在于，所述电子设备包括：相互耦接的存储器和处理器，所述处理器用于执行所述存储器中存储的程序指令，以实现如权利要求1-8任一项所述的图像压缩方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有程序数据，所述程序数据能够被处理器执行以实现如权利要求1-8任一项所述的图像压缩方法。

技术总结本发明公开了一种图像压缩方法、电子设备以及存储介质；其中图像压缩方法包括：获取原始图像，原始图像输入主压缩分支；编码器对原始图像进行编码生成第一图像数据；增益单元将第一图像数据进行动态调整再传输到量化模块；第一图像数据经量化模块处理得到第二图像数据；第二图像数据经解码器处理生成第一输出图像；第一图像数据和第二图像数据输入辅助压缩分支，辅助压缩分支基于第一图像数据和第二图像数据生成残差；第一输出图像基于残差和残差值参数输出最终图像。通过上述方式，本发明通过辅助压缩分支提升输出最终图像的视觉质量，且通过调节残差值参数实现了最终图像在机器认知和人眼认知之间的平衡，提高适用性。技术研发人员：金鑫,刘津铭,曾文军受保护的技术使用者：宁波东方理工大学（暂名）技术研发日：技术公布日：2024/8/1