一种条状目标的识别方法、系统、计算机设备和存储介质
- 国知局
- 2024-11-21 11:40:56
本发明涉及图像处理,尤其是涉及一种条状目标的识别方法、系统、计算机设备和存储介质。
背景技术:
1、条状目标(例如遥感图像中的道路)的识别在车辆导航、城市规划、自动驾驶中起着重要作用。现有的道路地图采集方法,如移动gps轨迹聚合或手动标注道路,无法处理大规模区域,同时这些方法耗时且无法及时更新动态环境,如自然灾害引起的变化中的道路网络。遥感影像覆盖范围广且可以提供最新的地理空间信息,这为道路网络的自动更新提供了一种可行的方案。
2、传统的道路识别研究利用低级特征并定义启发式规则从遥感影像中分割出道路。这些方法通常需要人工进行检查,不适用于大规模区域。近年来,具有编码器-解码器结构的cnn(convolutional neural networks,卷积神经网络)在图像语义分割中表现出较高的性能。一些道路提取研究也应用了cnn,然而由于遥感图像中存在的困难,这些方法通常会生成碎片化的道路段。道路的连通性是一个核心属性,确保道路连通性是进行其他下游任务的前提和关键条件。为了提高提取道路的连通性,一些方法首先生成道路的语义分割结果,然后采用后处理步骤来弥补缺失的道路。这些方法通常使用最短路径算法作为后处理,但这些后处理算法通常是为特定的道路图像设计的,泛化能力差且较为耗时。此外,也有研究通过构建迭代图过程或迭代优化连通性的方式,或者结合不同形状(例如点、边和区域)的道路特征到一个框架中,来提高道路连通性。然而,这些方法通常需要处理更多样的数据,并且需要更复杂的步骤进行训练。
3、由于卷积操作的内在局部性,基于cnn的方法缺乏建模显式远程关系的能力。为序列到序列预测的机器翻译任务而设计的transformer,不仅擅长学习输入标记之间的远程依赖关系,还展示了对全局上下文建模的优越能力,其在许多计算机视觉任务中也得到了探索并取得了较先进的性能。但利用transformer架构从遥感图像中识别线性道路时,面临以下挑战:(1)、传统的transformer采用方形图像块,这适用于大多数自然物体,但不适用于通常呈现细长形状的道路,使用方形图像块难以提取道路的大规模线性特征,并会引入更高的计算复杂度和内存占用;(2)、为了降低视觉transformer的计算成本,近期的研究工作尝试将自注意力限制在较小的局部区域,这妨碍了模型缓解影响道路可见性的局部遮挡问题的能力。
技术实现思路
1、针对上述问题,本发明申请提出了一种条状目标的识别方法、系统、计算机设备和存储介质,通过改进transformer结构中方形图像块和局部区域限制的学习过程,不仅能够获取道路区域不同维度的长程依赖关系,而且有效地降低了自注意力模块的内存和计算复杂度。
2、本发明一方面提供了一种条状目标的识别方法,包括如下步骤:
3、s1、获取待检测的条形目标的图像数据;
4、s2、预设条状目标识别模型,该模型包括依次连接的编码器模块、跨空间transformer模块和解码器模块;
5、s3、采用训练集对条状目标识别模型进行训练,并通过预设的损失函数计算损失,得到训练后的条状目标识别模型;
6、s4、将待检测条形目标的图像数据输入训练后的条状目标识别模型,训练后的条状目标识别模型中的编码器模块接收条形目标的图像数据并进行特征提取,输出图像特征,跨空间transformer模块接收图像特征并处理,输出跨空间感知特征,解码器模块接收跨空间感知特征并处理,输出待检测条形目标的识别结果。
7、优选地,s2中的编码器模块包括若干层依次连接的编码块,解码器模块包括与若干层编码块数量相同且依次连接的解码块,跨空间transformer模块包括若干个跨空间transformer块,若干层编码块与若干层解码块中除了最顶层以外其他层分别通过若干个跨空间transformer块对应连接。
8、优选地,s2中的编码器模块具体为深度残差网络,深度残差网络包括若干个依次连接的残差块,将条形目标的图像数据输入深度残差网络处理,若干个依次连接的残差块从条形目标的图像数据中依次提取出若干个图像特征。
9、优选地,s2中跨空间transformer模块中的每个跨空间transformer块均包括并行连接的条形注意力模块和跨像素注意力模块,条形注意力模块和跨像素注意力模块分别接收与其对应连接的编码块输出的图像特征并处理,相应输出条形注意力特征和跨像素注意力特征,将条形注意力特征和跨像素注意力特征进行拼接,将拼接后的特征作为对应的跨空间transformer块输出的跨空间感知特征。
10、优选地,条形注意力模块包括依次连接的第一归一化层、条形注意力层、第二归一化层以及第一多层感知机,条形注意力模块接收与其对应连接的编码块输出的图像特征并处理,输出条形注意力特征,具体过程如下:
11、s21、条形注意力模块接收与其对应连接的编码块输出的图像特征并将其拆分成水平方向条形特征块和垂直方向条形特征块;
12、s22、对水平方向条形特征块和垂直方向条形特征块预处理,得到第一融合特定位置嵌入后的线性特征;
13、s23、第一归一化层接收第一融合特定位置嵌入后的线性特征并处理,得到第一归一化后线性特征,条形注意力层接收第一归一化后线性特征并处理,得到条形注意力感知线性特征,第二归一化层接收条形注意力感知线性特征并处理,输出第二归一化后线性特征;
14、s24、将第二归一化后线性特征输入第一多层感知机处理,输出条形注意力特征。
15、优选地,跨像素注意力模块包括依次连接的第三归一化层、跨像素注意力层、第四归一化层和第二多层感知机,跨像素注意力模块接收与其对应连接的编码块输出的图像特征并处理,输出跨像素注意力特征,具体过程如下:
16、s25、跨像素注意力模块接收与其对应连接的编码块输出的图像特征并以预设间隔采样,对采样得到的像素嵌入特征进行拼接并预处理,得到第二融合特定位置嵌入后的线性特征。
17、s26、第三归一化层接收第二融合特定位置嵌入后的线性特征并处理,得到第三归一化后线性特征,跨像素注意力模块接收第三归一化后线性特征并处理,得到跨像素注意力感知线性特征,第四归一化层接收跨像素注意力感知线性特征并处理,输出第四归一化后线性特征;
18、s27、将第四归一化后线性特征输入第二多层感知机进行处理,得到跨像素注意力特征。
19、优选地,s2中解码器模块中的最底层解码块接收与其对应连接的跨空间transformer块输出的跨空间感知特征并处理,得到最底层解码特征,解码器模块中的其他非最底层解码块接收与其对应连接的跨空间transformer块输出的跨空间感知特征以及上一相邻层解码块输出的解码特征并处理,得到当前层解码块对应的解码特征,解码器模块中的最顶层解码块接收与其相邻的上一层解码块输出的解码特征,经过卷积处理后,输出最顶层解码块对应的解码特征,将最顶层解码块对应的解码特征作为条形目标的识别结果。
20、本发明另一方面提供了一种条状目标的识别系统,使用上述一种条状目标的识别方法对条状目标进行识别,该识别系统包括图像数据获取模块、条状目标识别模型以及计算机系统,图像数据获取模块与计算机系统连接,条状目标识别模型设置在计算机系统中,其中:
21、图像数据获取模块用于获取待检测的条形目标的图像数据,并将图像数据发送至计算机系统;
22、计算机系统接收图像数据并通过设置在其上的条形目标识别模型处理,得到图像的条形目标的识别结果。
23、本发明还提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述一种条状目标的识别方法的步骤。
24、本发明还提供了一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述一种条状目标的识别方法的步骤。
25、上述一种条状目标的识别方法、系统、计算机设备和存储介质,首先获取待检测的条形目标的图像数据,然后预设条状目标识别模型,该模型包括依次连接的编码器模块、跨空间transformer模块和解码器模块;接着对条状目标识别模型进行训练,得到训练后的条状目标识别模型;最后将待检测条形目标的图像数据输入训练后的条状目标识别模型,训练后的条状目标识别模型中的编码器模块接收条形目标的图像数据并进行特征提取,输出图像特征,跨空间transformer模块接收图像特征并处理,输出跨空间感知特征,解码器模块接收跨空间感知特征并处理,输出待检测条形目标的识别结果。该方法改进了transformer结构中方形图像块和局部区域限制的学习过程,利用跨空间并行transformer块,不仅能够获取条形目标区域不同维度、跨像素的长程依赖关系的长程依赖关系,而且有效地降低了自注意力模块的内存和计算复杂度,能够高效高精度地实现条状目标识别。
本文地址:https://www.jishuxx.com/zhuanli/20241120/332370.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。