一种面向边缘计算的人脸检测方法及系统与流程
- 国知局
- 2024-11-21 11:49:52
本技术涉及图像处理,尤其是涉及一种面向边缘计算的人脸检测方法及系统。
背景技术:
1、基于多头注意力机制(mha)的vision transformer自面世以来在多个视觉任务领域都取得了最先进的性能,其关键在于多头注意力机制(mha)允许token之间相互交互,进行全局表征学习。因此,在特征提取网络中应用多头注意力机制(mha)有助于特征提取;但大多数的transformer模型及其衍生模型因为时间复杂度为的多头注意力机制(mha)造成了计算效率的瓶颈和额外的参数,此外,mha需要复杂的操作以计算自注意力,不利于在边缘设备上部署。
2、在目标检测任务中,多尺度特征对于对具有尺度差异的对象进行编码非常重要。多尺度特征提取的常见策略是采用经典的自上而下和自下而上的特征金字塔网络(例如fpn和pafpn)。然而,自上而下的融合方法使得深层特征需要通过多个中间尺度传播并与这些尺度的特征交互,然后才能与底部的低级特征融合。在这个传播和交互过程中,来自高级特征的信息可能会丢失或降级。同样的,在自下而上的融合过程中,来自浅层特征的信息可能会在属性和交互过程中丢失或退化。这些方法都会造成深层和浅层特征信息丢失或退化,从而影响非相邻层级的融合效果。
3、因此,如何提升神经网络对图像的检测精度成为了亟待解决的技术问题。
技术实现思路
1、为了提升神经网络对图像的检测精度,本技术提供一种面向边缘计算的人脸检测方法及系统。
2、第一方面,本技术提供的一种面向边缘计算的人脸检测方法采用如下的技术方案:
3、一种面向边缘计算的人脸检测方法,包括:
4、获取人脸目标图像样本数据,并对所述人脸目标样本数据进行预处理以生成目标数据集;
5、获取预设神经网络模型,将所述目标数据集送入所述预设神经网络模型中进行迭代训练,并使用余弦退火算法对学习率进行调整;
6、在所述预设神经网络模型迭代训练完之后,获取所述预设神经网络模型的训练结果;
7、获取待检测人脸图片数据并结合所述训练结果以生成检测结果。
8、可选的,所述获取人脸目标图像样本数据,并对所述人脸目标样本数据进行预处理以生成目标数据集的步骤,包括:
9、获取人脸目标图像样本数据;
10、对所述人脸目标图像样本数据进行格式转换以生成第一数据集;
11、获取预设划分策略,并根据所述预设划分策略在所述第一数据集中生成训练集和验证集;
12、对所述训练集的数据随机应用数据增强策略以生成目标训练集;
13、根据所述验证集和所述目标训练集以生成目标数据集。
14、可选的,所述获取预设神经网络模型,将所述目标数据集送入所述预设神经网络模型中进行迭代训练,并使用余弦退火算法对学习率进行调整的步骤之前,还包括:
15、搭建ghostnetv2模型作为主干网络;
16、搭建特征融合增强网络afpn;
17、搭建ca模块和simam模块,并搭建目标检测头;
18、根据所述主干网络、所述特征融合增强网络afpn、所述ca模块、所述simam模块以及所述目标检测头生成预设神经网络模型。
19、可选的,所述获取预设神经网络模型,将所述目标数据集送入所述预设神经网络模型中进行迭代训练,并使用余弦退火算法对学习率进行调整的步骤,包括:
20、获取预设神经网络模型;
21、将所述目标数据送入所述预设神经网络模型中进行迭代训练并确定学习率;
22、使用warmup对所述学习率进行预热,将偏置层的学习率由0.1下降至0.01,其他参数的学习率由0增加至0.01;
23、在所述warmup的阶段结束之后,使用余弦退火算法对当前所述预设神经网络模型训练时的所述学习率进行更新。
24、可选的,所述将所述目标数据送入所述预设神经网络模型中进行迭代训练并确定学习率的步骤,包括:
25、将所述目标数据送入所述预设神经网络模型中,采用迁移学习的策略进行训练;
26、选择交叉熵损失函数作为所述预设神经网络模型对目标分类和定位的损失函数,选择α_ciou损失作为所述预设神经网络模型目标框回归的损失函数。
27、可选的,所述选择α_ciou损失作为所述预设神经网络模型目标框回归的损失函数的步骤,包括:
28、选择α_ciou损失通过预测相对位置的方法预测出目标框相对于不同尺度特征图网格左上角的相对坐标和相对高宽以得到预测目标框的中心坐标以及高宽,公式为:
29、
30、其中,是由网络模型预测得到的4个偏移量,为单元网格相对于图片左上角的偏移量,为先验框的宽高,是预测框的置信度,由预测框的目标真实概率和预测框与真实框的值相乘得到。
31、第二方面,本技术提供一种面向边缘计算的人脸检测系统,包括:
32、目标数据集模块,用于获取人脸目标图像样本数据,并对所述人脸目标样本数据进行预处理以生成目标数据集;
33、预设神经网络模块,用于获取预设神经网络模型,将所述目标数据集送入所述预设神经网络模型中进行迭代训练,并使用余弦退火算法对学习率进行调整;
34、训练结果模块,用于在所述预设神经网络模型迭代训练完之后,获取所述预设神经网络模型的训练结果;
35、检测结果模块,用于获取待检测人脸图片数据并结合所述训练结果以生成检测结果。
36、可选的,所述目标数据集模块,还用于获取人脸目标图像样本数据;
37、对所述人脸目标图像样本数据进行格式转换以生成第一数据集;
38、获取预设划分策略,并根据所述预设划分策略在所述第一数据集中生成训练集和验证集;
39、对所述训练集的数据随机应用数据增强策略以生成目标训练集;
40、根据所述验证集和所述目标训练集以生成目标数据集。
41、所述目标数据集模块,还用于获取人脸目标图像样本数据;
42、对所述人脸目标图像样本数据进行格式转换以生成第一数据集;
43、获取预设划分策略,并根据所述预设划分策略在所述第一数据集中生成训练集和验证集;
44、对所述训练集的数据随机应用数据增强策略以生成目标训练集;
45、根据所述验证集和所述目标训练集以生成目标数据集。
46、第三方面,本技术提供一种计算机设备,所述设备包括:存储器、处理器,所述处理器在运行所述存储器存储的计算机指令时,执行如上文所述的方法。
47、第四方面,本技术提供一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行如上文所述的方法。
48、综上描述,本技术包括以下有益技术效果:
49、本技术采用了具有解耦全连接注意力机制的主干网络用于特征提取,在实现自注意力机制的同时减少了随之产生的参数量和计算开销,有助于网络的边缘部署。通过ca模块和simam模块,使得网络更加注重训练样本的空间特征信息和通道特征信息,同时可以加快网络的收敛速度。采用了专门针对小目标检测场景而重新设计的特征融合增强网络,该网络可以在渐进式地融合不同尺度特征时能够自适应地调整各个特征图融合时的权重以实现更好的特征融合和增强,相比于传统的特征增强融合网络,该网络产生的参数量更少,计算开销更小,特征融和结果更好。实现了提升神经网络对图像的检测精度的技术效果。
本文地址:https://www.jishuxx.com/zhuanli/20241120/332924.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。