技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于改进SwinUNet的农田和城市遥感图像分割方法与流程 > 正文

一种基于改进SwinUNet的农田和城市遥感图像分割方法与流程

国知局
2024-12-06 12:10:58

本发明涉及农田城市遥感图像分割与深度学习，具体为一种基于改进swinunet的农田和城市遥感图像分割方法。

背景技术：

1、遥感图像分割是一种通过图像处理技术，将遥感图像中不同地物类别进行区分和提取的过程，在农业、城市规划、环境监测等领域具有广泛的应用；随着遥感技术的不断发展，获取的遥感图像分辨率越来越高，图像数据量也越来越大，对图像分割算法的精度和效率提出了更高的要求，传统的遥感图像分割方法主要依赖于像素级分类和区域增长技术，这些方法虽然在一定程度上能够满足需求，但在处理复杂地物场景时，往往存在精度不足、计算效率低下的问题，近年来，深度学习技术在图像处理领域取得了显著进展，其中以卷积神经网络(cnn)为代表的方法在图像分割任务中表现优异；以u-net为代表的u型网络在医学图像分割、遥感图像分割等领域被广泛应用，并显示出良好的效果；

2、然而，u-net网络在处理遥感图像分割任务时，依然存在一些局限性，例如，u-net在捕捉图像中长距离依赖关系和细节特征方面存在一定困难，且其在高分辨率图像处理中的计算开销较大，为了克服这些问题，研究者们提出了多种改进方法，其中swinunet作为一种基于transformer架构的网络，在遥感图像分割任务中表现出了较好的性能；swinunet通过引入滑窗机制，有效地平衡了计算效率和分割精度，在处理不同尺度的图像特征方面具有优势，然而，由于边界模糊、低对比度的地表特征以及不同地物在形状、大小、光谱特征等方面存在较大差异等因素，swin-unet提取的遥感图像仍然存在细节丢失、边缘模糊等问题，自动遥感图像分割仍然是一项具有挑战性的任务。

技术实现思路

1、本发明的目的在于提供一种基于改进swinunet的农田和城市遥感图像分割方法，以解决上述背景技术中提出的相关问题。

2、为实现上述目的，本发明提供如下技术方案：一种基于改进swinunet的农田和城市遥感图像分割方法，包括以下步骤：

3、步骤1：数据集准备，收集农田城市遥感图像公开数据集；

4、步骤2：对数据集进行划分，将数据集准备的数据集划分为训练集和测试集，进行模型的训练和测试；

5、步骤3：模型准备，设计一种基于改进swinunet的图像分割方法(adswinunet)，此模型在目前主流的图像分割方法swinunet的基础上进行改进：在瓶颈处增加了多尺度特征融合卷积(dac)模块和在跳跃连接处新增了注意力门控机制(ag)模块，其中；

6、(1)、在编码器中，输入的高分辨率遥感图像划分为不重叠的4×4大小的图像补丁，通过这种划分方法，每个补丁的特征维数变为4×4×3＝48；此外，将线性嵌入层应用于投影特征维数到任意维数(表示为c)，将分辨率为的c维标记化的token输入到两个连续的swintransformerblocks中进行表示学习，其中特征维数和分辨率保持不变，同时，补丁合并层将减少token的数量，并将特征维增加到原始维度的两倍，此过程将在编码器中重复三次，补丁合并层输入补丁分为4个部分；

7、(2)、在瓶颈处，引入dac模块，使用cnn和mbconv后分别进行了fi1和fi2的下采样，其中fi1表示使用cnn来进行第i层的下采样，fi2表示用mbconv对相应的层进行下采样，然后，通过将fi1和fi2通过权值ki1和ki2加权求和，然后将获得的特征输入到simam中，使用二维卷积(conv2d)对来自simam的这些特征进行下采样，dac模块表示公式为：fi＝conv2d(sinmam([ki1f1i，ki2f2i]))式中[·]为拼接操作，fi表示为经dac处理过的第i层特征图，初始化ki1和ki2为1.0；

8、(3)、在解码器部分，首先通过补丁扩展层对特征图进行上采样，将特征图恢复到原始图像的分辨率，解码器同样由多个swintransformer块和补丁扩展层组成，以第一个补丁扩展层为例，在上采样前，在输入特征8c上应用线性层，将特征尺寸增加到原始尺寸然后，通过使用重新排列操作将输入特征的分辨率扩展到输入分辨率的2倍，并将特征维度降低到输入维度的四分之一通过后续的补丁扩展层，特征图的尺寸逐步恢复到原始输入图像的分辨率，在解码器每一阶段的上采样过程中，使用跳跃连接将编码器中对应层的特征与解码器中上采样后的特征进行融合，具体步骤为，将编码器输出的特征和解码器当前层的特征输入到ag模块中，ag机制通过计算编码器和解码器特征之间的相关性，自适应地学习并融合这两者的信息；

9、(4)、通过上述步骤，解码器在每个阶段中不断地进行上采样，并通过跳跃连接将多尺度特征融合，最终将特征图恢复到与输入图像相同的分辨率；

10、步骤4：使用训练集对改进的swinunet模型进行训练，并且在测试集上验证评估该模型的性能。

11、优选的，所述步骤3中的ag机制通过计算编码器和解码器特征之间的相关性，自适应地学习并融合这两者的信息，其原理公式如下，qιatt，i＝ψt(σ1(wχtχiι+wgtg+bχg))+bψ，αι＝σ2(qιatt(χι，g；θatt))其中，σ1(x)是一个元素级的非线性函数(relu)，而σ2(x)是一个归一化函数，例如，可以应用sigmoid函数将范围限制为[0,1]，也可以应用这样注意映射求和为1，因此，ag的特征是一组参数θatt，其中包括：线性变换wx∈rf1×fint，wg∈rfg×fint，ψ∈rfint×1和偏差项bψ∈r，bxg∈rfint线性变换的计算使用1×1×1通道卷积。

12、优选的，所述步骤4中设计的训练和测试策略，具体实施步骤为：

13、(1)、使用步骤2中划分的训练集对构建好的adswinunet模型进行训练，再使用划分的测试集对训练好的模型进行测试；

14、(2)、设置对比实验，同样使用划分的数据集对其他图像分割模型如transunet和swinunet等进行训练测试，设计选择dice相似系数(dice similarity coefficient,dsc)和豪斯多夫距离(hausdorff distance，hd)作为评判指标，对比(1)步骤中显示的adswinunet模型效果，验证了其性能的优越性。

15、优选的，所述步骤3中的补丁合并层输入补丁分为4个部分，其中，由补丁合并层连接在一起，通过这样的处理，特征分辨率将被下采样为2的进行下采样，并且，由于连接操作导致特征维数增加了4倍，因此对连接的特征应用线性层，将特征维数统一到原始维数的2倍。

16、优选的，所述步骤1中农田城市遥感图像的数据集为rsscn7数据集。

17、优选的，所述步骤2中数据集的70％带标签的数据作为训练集，剩余30％数据集作为测试集，用于测试模型性能。

18、与现有技术相比，本发明提供了基于改进swinunet的农田和城市遥感图像分割方法，具备以下有益效果：

19、1、本发明通过为了克服传统图像分割方法存在误报识别和边缘模糊的问题，在swinunet的瓶颈处增加dac模块，在跳跃连接处新增了ag模块以增强特征图的关键信息，增强语义信息间的依赖关系，本发明设计了一种改进swinunet的农田和城市遥感图像分割方法adswinunet，此模型在本数据集上与其他模型对比，具有更优异的性能表现。

20、2、本发明利用解码器对编码后的特征进行上采样，然后将其与高分辨率的cnn特征图结合，以实现精确定位，通过在跳跃连接处新增注意力门控机制(attention gate，ag)模块以增强特征图的关键信息，增强语义信息间的依赖关系，最终输出高精度的分割结果，在实验阶段，建立评判方法，对实验结果进行分析和对比，验证该方法的有效性，能够显著提高农田和城市区域识别的准确率和效率，在一定程度上解决了分割准确度不足、边缘模糊和误报识别的问题，也为进一步通过探究深度学习方法提升遥感图像分割方法提供线索。