基于Itti算法的感兴趣区域检测方法、设备和介质与流程
- 国知局
- 2024-10-15 10:04:38
本发明涉及图像处理,具体而言,涉及一种基于itti算法的感兴趣区域检测方法、设备和介质。
背景技术:
1、在图像处理和计算机视觉领域,感兴趣区域(region ofinterest,roi)检测是一项基本而关键的技术,它旨在从复杂的图像中自动识别并突出显示具有特定重要性或感兴趣的区域。这项技术广泛应用于多种领域,包括医疗成像、视频监控、自动驾驶、内容推荐系统以及机器人视觉系统等。
2、传统的感兴趣区域检测方法往往依赖于特定的图像特征提取技术,如边缘检测、颜色分析和纹理识别等。这些方法通过预设的算法规则对特征进行简单的线性组合或加权求和,以尝试突出感兴趣区域。然而,这些传统方法面临着多个限制,主要是它们对于输入图像的适应性和灵活性不足,特别是在面对复杂场景和动态环境时,其性能往往不稳定。
3、具体地,在传统的线性融合方法中通常依赖于预设的参数和规则,这限制了其在面对复杂或动态变化的环境时的适应能力。当图像条件(如光照、背景复杂度)发生变化时,固定的融合策略可能无法有效地突出真正的感兴趣区域。而且线性融合方法在处理含有多个特征维度的数据时,很难捕捉和利用特征之间的复杂关系,因为它们通常忽略了特征间的交互作用,这在某些情况下可能导致关键信息的丢失。因为这些方法通常是在特定的数据集上开发和优化的,其参数和权重设置不具备自我调整的能力,这使得它们在应用于未见过的新场景或数据时表现得不够鲁棒,容易出现性能下降。
技术实现思路
1、本发明旨在至少解决现有技术中存在的技术问题之一。
2、为此,本发明第一方面提供了一种基于itti算法的感兴趣区域检测方法。
3、本发明第二方面提供了一种计算机设备。
4、本发明第三方面提供了一种计算机可读存储介质。
5、本发明提供了一种基于itti算法的感兴趣区域检测方法,包括:
6、接收输入图像,并基于多尺度提取该图像的颜色特征图、亮度特征图和方向特征图;
7、计算每个特征图的中心-边缘差异,并使用归一化算子进行处理,以增强图像中的局部对比度和特征显著性;
8、将所有将经过归一化算子处理的特征图输入至卷积神经网络中,通过卷积神经网络选择最有效的结合方式对各特征图进行结合,进而生成显著图;其中,所述最有效的结合方式包括为各特征图分配最优权重;
9、通过对所述显著图进行阈值处理,确定感兴趣区域。
10、根据本发明上述技术方案的基于itti算法的感兴趣区域检测方法,还可以具有以下附加技术特征:
11、在上述技术方案中,所述卷积神经网络包括:
12、多个输入层,每种特征图通过独立的输入层输入到网络中;
13、多个卷积层,用于提取和融合来自不同特征图的信息;所述卷积层还用于学习在特征合并过程中为每种特征分配权重;
14、池化层,用于降低特征的空间维度;
15、全连接层,将融合的特征映射到输出层,通过输出层预测图像中感兴趣区域的显著图。
16、在上述技术方案中,所述卷积神经网络的训练方法包括:
17、获取标注过的图像数据集,其中每张图像都标注了感兴趣区域;
18、对图像数据集中的每张图像在多尺度提取其颜色特征图、亮度特征图和方向特征图;
19、将各特征图输入到卷积神经网络中进行训练;通过卷积层、激活函数、池化层和全连接层,得到感兴趣区域预测结果;
20、根据损失函数计算感兴趣区域预测结果与真实标注之间的损失;
21、使用反向传播算法计算损失函数相对于每个权重的梯度;
22、根据梯度和学习率更新网络权重。
23、在上述技术方案中,所述损失函数采用像素级的交叉熵损失函数。
24、在上述技术方案中,所述根据梯度和学习率更新网络权重包括使用adam优化器进行训练,调整网络权重,最小化损失函数。
25、在上述技术方案中,所述卷积神经网络的训练方法还包括:
26、在独立的验证数据集上测试模型性能,监控准确率;
27、根据测试结果调整网络架构或训练参数。
28、在上述技术方案中,所述接收输入图像,并基于多尺度提取该图像的颜色特征图、亮度特征图和方向特征图,包括:
29、利用图像金字塔将输入图像处理为多个空间尺度表示;多个空间尺度下图像的分辨率不同;
30、利用线性滤波器提取输入图像在每个空间尺度下的颜色特征、亮度特征和方向特征,以分别生成颜色特征图、亮度特征图和方向特征图。
31、在上述技术方案中,所述对所述显著图进行阈值处理包括:应用wta机制,选择显著图中显著性最高的区域作为感兴趣区域,并实施抑制返回,以抑制在后续处理中已被识别为显著的区域的再次识别,从而允许系统重点处理其他未被识别的显著区域。
32、本发明还提供了一种计算机设备,包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载并执行时实现如上述技术方案中任一项所述的基于itti算法的感兴趣区域检测方法。
33、本发明又提供了一种计算机可读存储介质,存储有程序,当所述程序被处理器加载时实现如上述技术方案中任一项所述的基于itti算法的感兴趣区域检测方法。
34、综上所述,由于采用了上述技术特征,本发明的有益效果是:
35、本发明提出的基于itti算法的感兴趣区域检测方法中基于卷积神经网络的特征权重分配方式进行特征图融合,相较于传统的线性融合方式,在感兴趣区域检测的效率和准确性上带来了显著的优势。
36、具体地,与传统的线性融合方式相比,卷积神经网络能够自动学习和调整各特征图的融合权重。这种动态权重分配机制根据训练数据自动优化权重,使得模型能够更精确地反映不同特征对感兴趣区域识别的贡献度,从而提升整体的检测准确性。
37、卷积神经网络通过学习大量样本,能够掌握各种环境下的特征融合策略,使得该方法不仅适用于训练时见过的图像类型,也能良好地适应新的、未见过的环境或场景,显著提升模型的泛化能力。
38、该方法可以根据具体应用需求调整网络结构或训练策略(如层数、滤波器大小、激活函数等),以适应不同的感兴趣区域检测任务,显示出高度的灵活性和可配置性。
39、卷积神经网络天生支持并行处理,这使得特征融合过程可以在现代gpu上高效执行,大幅度减少计算时间,特别是对于高分辨率图像或实时视频流的处理,这一优势尤为明显。
40、卷积神经网络通过整合多个特征图并自动调整权重,对输入图像的小幅扰动或噪声具有更好的容忍性。这种鲁棒性对于实际应用中常见的图像质量问题至关重要。
41、本发明的附加方面和优点将在下面的描述部分中变得明显,或通过本发明的实践了解到。
技术特征:1.一种基于itti算法的感兴趣区域检测方法,其特征在于,包括:
2.根据权利要求1所述的基于itti算法的感兴趣区域检测方法,其特征在于,所述卷积神经网络包括:
3.根据权利要求2所述的基于itti算法的感兴趣区域检测方法,其特征在于,所述卷积神经网络的训练方法包括:
4.根据权利要求3所述的基于itti算法的感兴趣区域检测方法,其特征在于,所述损失函数采用像素级的交叉熵损失函数。
5.根据权利要求3所述的基于itti算法的感兴趣区域检测方法,其特征在于,所述根据梯度和学习率更新网络权重包括使用adam优化器进行训练,调整网络权重,最小化损失函数。
6.根据权利要求3所述的基于itti算法的感兴趣区域检测方法,其特征在于,所述卷积神经网络的训练方法还包括:
7.根据权利要求1所述的基于itti算法的感兴趣区域检测方法,其特征在于,所述接收输入图像,并基于多尺度提取该图像的颜色特征图、亮度特征图和方向特征图,包括:
8.根据权利要求1所述的基于itti算法的感兴趣区域检测方法,其特征在于,所述对所述显著图进行阈值处理包括:应用wta机制,选择显著图中显著性最高的区域作为感兴趣区域,并实施抑制返回,以抑制在后续处理中已被识别为显著的区域的再次识别,从而允许系统重点处理其他未被识别的显著区域。
9.一种计算机设备,其特征在于,包括处理器和存储器,所述存储器中存储有计算机程序,当所述计算机程序被所述处理器加载并执行时实现如权利要求1至8中任一项所述的基于itti算法的感兴趣区域检测方法。
10.一种计算机可读存储介质,其特征在于,存储有程序,当所述程序被处理器加载时实现如权利要求1至8中任一项所述的基于itti算法的感兴趣区域检测方法。
技术总结本发明提供了一种基于Itti算法的感兴趣区域检测方法、设备和介质,方法包括:接收输入图像,并基于多尺度提取该图像的颜色特征图、亮度特征图和方向特征图;计算每个特征图的中心‑边缘差异,并使用归一化算子进行处理,以增强图像中的局部对比度和特征显著性;将所有将经过归一化算子处理的特征图输入至卷积神经网络中,通过卷积神经网络选择最有效的结合方式对各特征图进行结合,进而生成显著图;其中,所述最有效的结合方式包括为各特征图分配最优权重;通过对所述显著图进行阈值处理,确定感兴趣区域。本发明的方法通过采用基于卷积神经网络的特征融合方式,显著提高了感兴趣区域检测的准确性、效率和鲁棒性。技术研发人员:斯雷,邓宇翔,邹西山,李韩,谢舒安,唐瑞,罗岚,罗志亮受保护的技术使用者:联通沃音乐文化有限公司技术研发日:技术公布日:2024/10/10本文地址:https://www.jishuxx.com/zhuanli/20241015/316354.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。