一种基于深度学习的内窥镜息肉图像检测方法
- 国知局
- 2024-09-11 14:52:29
本发明涉及目标检测,具体涉及一种基于深度学习的内窥镜息肉图像检测方法。
背景技术:
1、随着深度学习的迅速发展,计算机辅助息肉识别在结直肠筛查和检测中展现了高分析质量和低成本的潜力。基于深度学习的人工智能系统能够利用大量数据,自动学习分类模式,并从复杂的未标记数据中提取特征,减少人工干预的需求。在医学领域,尤其是在诊断性结肠镜检查中,基于深度学习技术的人工智能系统正在不断发展。mo等人的研究采用未修改的卷积神经网络(faster r-cnn)架构来进行息肉检测,与以往方法不同的是,他们的算法可以检测到大部分被遮挡的息肉。shin等人,提出一种基于区域的卷积神经网络(cnn)方法来自动检测结肠息肉,该研究通过使用深度卷积神经网络(inception resnet)作为迁移学习方案,克服了少量息肉图像和检测障碍,并提出了自动误报学习和离线学习两种后学习方法,与基于区域的检测系统相结合实现了可靠的息肉检测,进一步优化了模型并减少误报。pacal等人,提出了一种基于改进的yolov3、yolov4算法的实时息肉检测算法,该算法结合了多项关键技术,以实现高性能、实时的自动息肉检测。首先,通过集成跨阶段部分网络(cspnet)来实现实时、高性能的自动息肉检测。其次,利用先进的数据增强技术和迁移学习来提高息肉检测的性能。最后,使用sigmoid加权线性单元(silu)激活函数代替leaky relu和mish激活函数来提升该模型在息肉检测上的准确性与实时性。yang等人,提出了一种随机高效的自动息肉检测和分割的通道注意力网络(secanet),通过获得跨渠道交互来学习有效的渠道注意力提升模型的检测精度。zhang等人,提出了一种基于ssd改进的计算机辅助息肉识别算法ssd-gpnet,该算法通过重新利用池化层中丢失的数据,并将其链接为额外的特征图,以提高检测器的精度和效率。puyal等人,提出了一种名为dp-cnn的双路径卷积神经网络算法,用于增强后图片的息肉检测。该算法采用了dp-cnn架构和sigmoid分类器,通过这种结构和分类器的组合,算法在公开数据集上取得了令人满意的结果。park等人提出了一种名为swine-net的新模型,该模型结合了efficientnet和swintransformer算法,用于准确且鲁棒地进行结直肠息肉分割。wang等人提出了一种名为panet的新型原型对齐网络,该网络从度量学习的角度解决了具有挑战性的少样本分割问题,使其能够更好地利用支持集的信息,并通过原型对齐的方式提高少样本分割的性能。wesp等人,利用3d ct结肠成像图像进行训练,开发了两个模型:seg模型和noseg模型,用于预测息肉的类别,与此前的方法不同,seg模型还利用了息肉分割掩模进行训练,以提高预测的准确性。这项研究的贡献在于采用了子卷积训练和分割掩模的方法,为准确预测息肉类别提供了一种新的方法。ma等人提出了一种实时息肉检测框架专用于结肠检查视频,该框架通过将swin transformer与yolov5m网络集成,以增强对息肉特征的局部和全局信息的提取能力,同时为了减少光线变化和反射等因素的影响,该研究还利用时间序列的集成预测方法,提高了检测结果的时间连续性。
2、尽管基于深度学习的目标检测算法在息肉检测领域已经取得了显著的突破,但是在实际应用中,息肉识别的高准确性和实时性仍然受到肠道的特殊结构以及普通结肠镜本身视野、分辨率、组织学辨别局限性的影响。因此,设计出一种检测精度高且计算开销低的息肉检测算法势在必行。
技术实现思路
1、发明目的:本发明的目的是提供一种基于深度学习的内窥镜息肉图像检测方法以解决现有模型在特征捕捉和训练样本不足方面的挑战。
2、技术方案:本发明所述的一种基于深度学习的内窥镜息肉图像检测方法,包括如下步骤:
3、(1)对已获取到数据集命名为polyp dataset,对其进行预处理,得到处理后的数据集划分为四个类别;
4、(2)搭建改进的yolov5模型即在颈部网络部分引入asff结构;
5、(3)在特征预测头部的每个阶段引入动态卷积模块;
6、(4)利用搭建好的模型在训练集上进行训练并在测试集上进行验证,实现对结直肠息肉的预测。
7、进一步的,所述步骤(1)具体为:使用lableimg对图像进行标注即根据数据类型标注息肉类型的目标或属性,并将标注结果转换为文本格式,包括目标id、位置坐标及宽高信息,然后按照比例划分为训练集、验证集和测试集;
8、进一步的,所述步骤(2)具体如下:包括:恒等缩放和自适应融合,包括以下步骤:
9、(21)恒等缩放具体如下:对于上采样,首先使用卷积层将特征的通道数压缩到相应级别,然后通过插值方式提升分辨率;对于下采样,使用步长为2的卷积层调整通道数和分辨率;对于最细粒度的尺度,在进行步长为2的卷积之前添加步长为2的最大池化层。
10、(22)自适应融合公式如下:
11、
12、
13、其中,表示通道之间输出的特征图yl的第(i,j)个向量;对于权重参数α,β和γ,经过concat之后通过softmax使得他们的范围都在[0,1]内并且和为1。
14、进一步的,所述步骤(3)具体如下:通过扫描全局图像获得重要的候选目标区域,然后引入动态卷积模块,根据输入数据的特征动态地调整卷积核的形状和大小,以适应不同的息肉输入数据;动态卷积模块公式如下:
15、y=(αω1wαf1 wαc1 wαs1 ww1+…+αωn wαfn wαcn wαsn wwn)*x
16、其中αωi∈r,表示卷积核wi的标量,αsi∈rk×k、和表示三个新引入的注意力,分别沿着卷积核wi的空间维度、输入通道维度和输出通道维度计算,w表示沿核空间不同维度的乘法运算。
17、本发明所述的一种基于深度学习的内窥镜息肉图像检测系统,包括:
18、预处理模块:用于对已获取到数据集命名为polyp dataset,对其进行预处理,得到处理后的数据集划分为四个类别;
19、yolov5模块:用于搭建改进的yolov5模型即在颈部网络部分引入asff结构;
20、动态卷积模块:用于在特征预测头部的每个阶段引入动态卷积模块;
21、预测模块:用于利用搭建好的模型在训练集上进行训练并在测试集上进行验证,实现对结直肠息肉的预测。
22、进一步的所述预处理模块中,使用lableimg对图像进行标注即根据数据类型标注息肉类型的目标或属性,并将标注结果转换为文本格式,包括目标id、位置坐标及宽高信息,然后按照比例划分为训练集、验证集和测试集;
23、进一步的,所述yolov5模块中,包括:恒等缩放和自适应融合,包括以下步骤:
24、(21)恒等缩放具体如下:对于上采样,首先使用卷积层将特征的通道数压缩到相应级别,然后通过插值方式提升分辨率;对于下采样,使用步长为2的卷积层调整通道数和分辨率;对于最细粒度的尺度,在进行步长为2的卷积之前添加步长为2的最大池化层。
25、(22)自适应融合公式如下:
26、
27、其中,表示通道之间输出的特征图yl的第(i,j)个向量;对于权重参数α,β和γ,经过concat之后通过softmax使得他们的范围都在[0,1]内并且和为1。
28、进一步的,所述动态卷积模块中,通过扫描全局图像获得重要的候选目标区域,然后引入动态卷积模块,根据输入数据的特征动态地调整卷积核的形状和大小,以适应不同的息肉输入数据;动态卷积模块公式如下:
29、y=(αω1wαf1 wαc1 wαs1 ww1+…+αωn wαfn wαcn wαsn wwn)*x
30、其中αωi∈r,表示卷积核wi的标量,αsi∈rk×k、和表示三个新引入的注意力,分别沿着卷积核wi的空间维度、输入通道维度和输出通道维度计算,w表示沿核空间不同维度的乘法运算。
31、本发明所述的一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述计算机程序被加载至处理器时实现任一项所述的一种基于深度学习的内窥镜息肉图像检测方法。
32、本发明所述的一种存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现任一项所述的一种基于深度学习的内窥镜息肉图像检测方法。
33、有益效果:与现有技术相比,本发明具有如下显著优点:(1)在颈部网络中,asff结构通过动态地选择和融合多层特征图,使得网络能够更好地捕捉目标的多尺度信息;(2)在特征预测头部的每个阶段设计引入了动态卷积来提高结直肠息肉检测的准确性和效率。通过可学习的形变模块,根据输入数据的特征动态地调整卷积核的形状和大小,以适应不同的息肉输入数据。
本文地址:https://www.jishuxx.com/zhuanli/20240911/292415.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。