技术新讯 > 计算推算,计数设备的制造及其应用技术 > 基于Segformer的轻量级遥感图像城市水域识别方法和相关装置 > 正文

基于Segformer的轻量级遥感图像城市水域识别方法和相关装置

国知局
2024-07-31 23:26:43

本发明属于城市水域识别，具体涉及一种基于segformer的轻量级遥感图像城市水域识别方法和相关装置。

背景技术：

1、随着遥感技术的快速发展，城市水域在遥感图像中的准确分割变得至关重要。这种分割技术不仅为城市规划建设提供了重要的信息支持，还在环境监测、灾害预警等领域发挥着不可替代的作用。然而，当前城市水域识别技术面临的一个关键挑战是如何在计算资源有限的设备上实现高效且准确的识别。

2、深度学习模型，尤其是卷积神经网络(cnn)，因其强大的特征提取和学习能力，在遥感图像分割领域取得了显著成果。然而，这些模型通常具有庞大的参数量和复杂的计算过程，对计算资源的要求极高，这限制了它们在资源受限场景中的应用。特别是在洪水灾害监测等紧急情况下，快速、准确的预测对于防灾减灾至关重要，但此时往往难以获取到足够的计算资源来支持复杂的深度学习模型。

3、为了解决这个问题，轻量化模型的设计成为了研究的热点。这些模型通过优化网络结构、减少参数量、降低计算复杂度等手段，在保持一定识别精度的同时，大大降低了对计算资源的需求。这对于在移动平台、嵌入式系统和边缘计算环境中实现实时、高效的遥感分割应用具有重要意义。

4、segformer作为一种先进的语义分割框架，以其简单、高效且强大的性能在遥感图像分割领域得到了广泛关注。segformer通过引入transformer结构和一系列创新设计，在保持高分割精度的同时，相比传统cnn模型具有更高的计算效率。然而，即便如此，segformer在计算资源有限的边缘设备上仍然面临一定的挑战。为了将segformer应用于更广泛的场景，特别是边缘计算环境，需要对其进行进一步的轻量化改进，以降低计算负担并提高实时性。

技术实现思路

1、针对现有技术中存在的问题，本发明提供了一种基于segformer的轻量级遥感图像城市水域识别方法和相关装置，能够在计算资源有限的设备上实现高效、准确的城市水域识别。

2、为了解决上述技术问题，本发明通过以下技术方案予以实现：

3、根据本发明的第一方面，提供一种基于segformer的轻量级遥感图像城市水域识别方法，包括：

4、获取待识别的遥感图像；

5、将所述遥感图像输入城市水域识别模型，得到识别结果；所述城市水域识别模型为采用包含城市水域的遥感图像样本训练改进的segformer模型得到，所述改进的segformer模型包括改进的biformer编码器和解码器，所述改进的biformer编码器中的transformer block层包括双重注意力特征增强模块，所述双重注意力特征增强模块由双层路由注意力机制模块和递归空洞自注意力机制模块构成，所述改进的biformer编码器中用于提取遥感图像的特征图；所述解码器中的上采样层采用carafe算子，所述解码器用于对所述特征图进行特征重构，得到识别结果。

6、在第一方面的一种可能的实现方式中，所述双层路由注意力机制模块利用上下层路由器自适应地分配注意力权重，所述递归空洞自注意力机制模块利用递归机制和空洞卷积自注意力增加模型深度。

7、在第一方面的一种可能的实现方式中，所述双层路由注意力机制模块的具体流程包括：

8、(1)划分区域和线性映射：将输入的特征图通过线性映射得到q、k、v张量，该过程公式如下：

9、q＝xrwq

10、k＝xrwk

11、v＝xrwv

12、式中，x表示输入特征图，wq、wk、wv分别为查询q、键k、值v的投影权值。

13、(2)通过有向图实现区域间的路由：在粗粒度token上计算注意力权重，然后仅取其中的top-k区域作为相关区域参与细粒度的运算，具体为：对q，k沿区域平均化得到qr,kr，然后通过公式推导出邻接矩阵ar，所述邻接矩阵ar用于找到城市水域遥感图像中给定区域在特征信息上的相关性，根据区域间的相关性推出索引矩阵ir，该过程公式如下：

14、ar＝qr(kr)t

15、ir＝topindex(ar)

16、式中，qr和kr为区域级查询和键，topkindex()表示使用逐行topk运算符推导出索引矩阵ir；

17、(3)token-to-token注意力：利用索引矩阵ir计算细粒度token-to-token注意力，具体为：首先通过gather()得到这k个区域的所有键值张量，然后通过attention()对聚集后的键值张量进行注意力操作，该过程公式如下：

18、kg＝gather(k,ir)

19、vg＝gather(v,ir)

20、o＝attention(q,kg,vg)+lce(v)

21、式中，kg,vg表示收集到的键值张量，gather()表示收集该区域中所有k和v的公式，attention()表示注意力计算的公式，lce(v)表示局部上下文增强项，函数lce(·)用深度卷积参数化。

22、在第一方面的一种可能的实现方式中，所述递归空洞自注意力机制模块由空洞卷积自注意力模块和递归管道组成；在计算查询和键之间的相似度时，空洞卷积自注意力模块利用具有单个内核的多尺度上下文来增强查询和键之间的相关性判断；所述递归管道按照标准递归网络的设计，将递归空洞自注意力机制模块构造成一个递归模块，所述空洞卷积自注意力模块充当激活函数。

23、在第一方面的一种可能的实现方式中，所述carafe算子包括核预测模块和特征重组模块，所述核预测模块用于动态地预测和生成适应不同上下文环境的上采样核，所述特征重组模块用于对特征进行上采样，以增加特征图的分辨率和深度。

24、根据本发明的第二方面，提供一种基于segformer的轻量级遥感图像城市水域识别装置，包括：

25、获取模块，用于获取待识别的遥感图像；

26、识别模块，用于将所述遥感图像输入城市水域识别模型，得到识别结果；所述城市水域识别模型为采用包含城市水域的遥感图像样本训练改进的segformer模型得到，所述改进的segformer模型包括改进的biformer编码器和解码器，所述改进的biformer编码器中的transformer block层包括双重注意力特征增强模块，所述双重注意力特征增强模块由双层路由注意力机制模块和递归空洞自注意力机制模块构成，所述改进的biformer编码器中用于提取遥感图像的特征图；所述解码器中的上采样层采用carafe算子，所述解码器用于对所述特征图进行特征重构，得到识别结果。

27、根据本发明的第三方面，提供一种设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现所述的一种基于segformer的轻量级遥感图像城市水域识别方法的步骤。

28、根据本发明的第四方面，提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现所述的一种基于segformer的轻量级遥感图像城市水域识别方法的步骤。

29、与现有技术相比，本发明至少具有以下有益效果：

30、本发明提供的一种基于segformer的轻量级遥感图像城市水域识别方法，城市水域识别模型为采用包含城市水域的遥感图像样本训练改进的segformer模型得到，改进的segformer模型包括改进的biformer编码器和解码器，改进的biformer编码器中的transformer block层包括双重注意力特征增强模块，双重注意力特征增强模块由双层路由注意力机制模块和递归空洞自注意力机制模块构成，通过两种信息融合策略即可充分发挥特征之间的相互补充作用，解决模型在较浅和较薄的网络中提取特征能力有限、受到参数数量和模型深度限制的问题。解码器中的上采样层采用carafe算子，carafe算子可有效缓解传统上采样造成的马赛克和锯齿现象，进而提高城市水域识别任务的精度。可见，本发明方法通过优化segformer的网络结构，减少参数量和计算复杂度，使其能够在计算资源有限的设备上实现高效、准确的城市水域识别。这种方法不仅能够满足城市规划建设、环境监测等领域对实时性和准确性的要求，还能够推动城市水域管理、环境保护和可持续发展的进程。

31、为使本发明的上述目的、特征和优点能更明显易懂，下文特举较佳实施例，并配合所附附图，作详细说明如下。