技术新讯 > 计算推算,计数设备的制造及其应用技术 > 一种基于卷积神经网络的西北地区熊类识别方法  >  正文

一种基于卷积神经网络的西北地区熊类识别方法

  • 国知局
  • 2024-07-31 23:14:04

本技术属于图像识别,具体地说,尤其涉及一种基于卷积神经网络的西北地区熊类识别方法。

背景技术:

1、在祁连山区等西北地区,随着生态环境的恢复,棕熊等野生动物的种群数量逐年恢复增长态势,但是,棕熊等熊类是世界上体型较大的哺乳动物之一,具有较强的攻击性,一旦侵入到人类的居住区或者养殖区,会对人身、财产造成威胁,在棕熊频繁出没的区域,不仅需要设置警示牌提醒群众注意出行安全,还可采用驱离装置,通过发出驱离信号,使得熊类在驱离信号的驱使下远离人类居住区或养殖区,而准确的发出驱离信号择需要对进入到检测区域的熊类进行准确识别,如何实现对熊类的准确识别,择成为行业需要解决的技术问题之一。

技术实现思路

1、本技术的目的在于提供一种基于卷积神经网络的西北地区熊类识别方法,其能够通过卷积神经网络对获取的图像进行识别,以判断是否为熊类,并且根据识别的结果判断是否发出驱离信号,保障人员及财产的安全。

2、为达到上述目的,本技术是通过以下技术方案实现的:

3、本技术中所述的一种基于卷积神经网络的西北地区熊类识别方法,该方法包括以下步骤,

4、s1、收集西北地区熊类的训练数据图片并泛化处理数据,制作第一类样本数据集和第二类样本数据集;

5、s2、在步骤s1的基础上,以第一类样本数据集训练及调试第一深度学习模型;

6、s3、在步骤s1的基础上,以第二类样本数据集训练及调试第二深度学习模型;

7、s4、在待检测区域的电子设备中部署步骤s2、步骤s3所形成的第一深度学习模型、第二深度学习模型;

8、s5、导入实时拍摄的图片,通过第一深度学习模型、第二深度学习模型进行自动识别并输出识别结果,判断是否发出驱赶指令。

9、作为优选的技术方案之一,本技术中所述的步骤s1收集的训练数据图片,包括熊类全身、半身、带面部以及不带面部图片数据;步骤s1中所述泛化处理数据,包括反转、随机比例遮盖、提高或降低亮度、提高或降低对比度、通过roboflow平台手动标记训练数据图片中涉及熊类的像素框,roboflow平台生成包括图片类别和像素位置的图片文件。

10、作为优选的技术方案之一,本技术中所述的步骤s1中所述的第一类样本数据集指的是所收集的训练数据图片中包含多个西北地区熊类目标对象;所述步骤s2中所述的第二类样本数据集指的是所收集的训练数据图片中包含单个西北熊类目标对象;所述第一类样本数据集和第二类样本数据集分别作为训练集、验证集、测试集,其中训练集占第一样本数据集和第二类样本数据集的70%,验证集、测试集各占第一类样本数据集和第二类样本数据集的15%。

11、作为优选的技术方案之一,本技术中所述的步骤s2还包括,

12、s21、构建卷积神经网络构成的yolov8n模型,作为第一深度学习模型;

13、s22、将第一类样本数据集中的图片送入yolov8n模型,以是否是熊的置信度作为输出,以最小化第一深度学习模型损失函数值作为训练目标,采用反向传播算法和梯度下降算法迭代训练模型;当第一深度学习模型损失函数值小于等于预设的第一目标损失函数且趋于稳定时停止训练;

14、s22、根据yolov8n模型正确率调整学习率与lou阈值再次送入步骤s22重复训练,直至得到熊类识别深度学习模型。

15、作为优选的技术方案之一,本技术中所述的步骤s3包括,

16、s31、构建卷积神经网络构成的resnet模型,作为第二深度学习模型;

17、s32、将第二类样本数据集中的图片调整至高宽像素值为320×320,并将调整后的图片输入至resnet模型中,以是否是熊的预测值作为输出,选择交叉熵损失函数和随机梯度下降优化器,使用sigmod衰减算法,学习率随训练迭代的增大而减小,其计算公式如下:

18、;其中为每一轮优化时使用的学习率;为初始学习率;为全局迭代轮数,为当前迭代轮数;,,;

19、s33、继续训练resnet模型直至收敛,根据resnet模型的准确率调整resnet模型参数,并重复步骤s32,直至得到增强鲁棒性后的第二深度学习模型。

20、作为优选的技术方案之一,本技术中所述的步骤s4中所述待检测区域划分为n个大小相等的区域,每个大小相等的区域内分别设置有m个耐低温摄像头,将标记为第n个区域第m个耐低温摄像头,其中,<mstyle displaystyle="true" mathcolor="#000000"><mi>n</mi><mi>∈</mi><mi>[</mi><mn>1</mn><mi>,</mi><mi>n</mi><mi>]</mi></mstyle>,<mstyle displaystyle="true" mathcolor="#000000"><mi>m</mi><mi>∈</mi><mi>[</mi><mn>1</mn><mi>,</mi><mi>m</mi><mi>]</mi></mstyle>;每个区域内还存在着一个边缘计算设备作为部署第一深度学习模型、第二深度学习模型的电子设备,将训练完成的第一深度学习模型、第二深度学习模型分别部署到边缘计算设备中,用于处理该区域内m个耐低温摄像头传输的视频数据,上传视频并标记区域号。

21、作为优选的技术方案之一,本技术中所述的步骤s5中通过bearcv程序调用部署在边缘计算设备中的第一深度学习模型、第二深度学习模型,并采用如下的步骤:

22、s51、边缘计算设备实时逐帧读取耐低温摄像头传输的视频数据,并将逐帧读取的图片数据传递至第一深度学习模型中,对于置信度大于0.5的图片对象保存像素框坐标,并计算危险系数;

23、s52、对于置信度大于0.15、小于0.5的图片对象进行缩放降噪,得到第二深度学习模型所需的输入图片尺寸;

24、步骤s53、将缩放去噪后的图片输入至第二深度学习模型中,得到目标图像的置信度,当置信度大于0.5时,采用缩放前保存的像素框计算危险系数,其余舍弃。

25、作为优选的技术方案之一,本技术中所述的步骤s52中对图片对象进行缩放降噪时,先保存像素框坐标,再以像素框坐标截取图像,等比例缩放成第二深度学习模型所需的高宽像素值为320×320的图片,并保留原始图像的纵横比,使用高斯滤波器去除高频噪音,采用背景色填充,然后输入到第二深度学习模型得到目标的置信度;图片缩放降噪的转换公式如下:

26、;其中,h为第二深度学习模型所输入图像像素的高,w为第二深度学习模型所输入图像像素的宽;为截取后的图像像素的宽,为截取后的图像像素的高;为等比例缩放后的图像的宽,为等比缩放后的图像的高;表示对图像进行高斯滤波处理;将图像用背景色填充至。

27、所述步骤s51、步骤s53中获取的危险系数,其表达式为:

28、;

29、其中,为第一深度学习模型的图像置信度,为第二深度学习模型的图像置信度,、为平衡因子,为目标图像左上角像素框坐标,为目标图像右下方像素框坐标,表示像素框面积,为衡量参数,为危险系数。

30、与现有技术相比,本技术的有益效果是:

31、本技术能够对目标区域中出现的动物是否为西北熊类进行判断,并且根据所获取的危险系数判断是否需要发出驱离信号,以保证目标区域内人员及财产的安全。

本文地址:https://www.jishuxx.com/zhuanli/20240730/196559.html

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。