人脸检测模型的构建方法以及轨迹分析方法与流程
- 国知局
- 2025-01-10 13:26:09
本技术涉及深度学习领域,特别是涉及一种人脸检测模型的构建方法以及轨迹分析方法。
背景技术:
1、人脸识别作为目前人工智能领域中成熟较早、落地较广的技术之一,人脸识别的目的是要判断图片和视频中人脸的身份。从平常手机的刷脸解锁、刷脸支付,再到安防领域内的人脸识别布控,等等,人脸识别技术都有着广泛的应用,传统的机器学习算法主要有三部分组成:建议框生成、特征工程以及分类,所以传统的机器学习算法是基于特征的算法,因此需要大量的算法工程师的专家经验进行特征工程和调参等工作,算法效果也不是很好,尤其是在人脸识别领域中,过去的图像算法是工程师更多的是通过传统的图像处理方法,根据现实场景和专家经验提取大量的特征,然后对提取的特征再进行统计学习的处理,这样整体算法的性能就非常依赖于现实场景和专家经验,对于人脸这种类别巨大,每类样本不均衡情况严重的无约束场景效果并不是很好,因此,近几年随着深度学习在图像处理中取得的巨大成功,人脸识别技术也都以深度学习为主,并且已经达到了非常好的效果。
2、在深度学习的人脸识别系统中,该问题被分成了一个目标检测问题和一个分类问题,而目标检测问题在深度学习中本质还是一个分类问题和回归问题,因此随着卷积神经网络在图片分类上的成功应用,人脸识别系统的效果得到了快速且巨大的提升,并以此诞生了大量的视觉算法公司,并将人脸识别应用在了社会生活的各个方面,在深度学习中,一个完整的人脸识别系统也包括四个步骤,其中第一步骤叫做人脸检测算法,本质也是一个目标检测算法。第二个步骤叫做人脸对齐,目前又基于关键点的几何对齐和基于深度学习的人脸对齐。第三个步骤特征表示,在深度学习中是通过分类网络的思想,提取分类网络中的一些feature层作为人脸的特征表示,然后用相同的方式对标准人脸像进行处理,最后通过比对查询的方式完成整体的人脸识别系统。
3、人脸识别除了在刷脸解锁、刷脸支付等场景进行应用,通过对不同监控摄像头获取的视频进行人脸识别还可以对行人的轨迹进行分析,在一些重点区域,如学校等地方来对一些人员的活动范围进行分析从而实行智能的管控,但是在通过监控摄像头进行人脸识别时会存在一些遮挡问题和尺度问题无法解决,现有技术为了解决遮挡和尺度问题往往通过引入一些新的网络框架来进行训练,但是引入新的网络结构势必会增加人脸的识别时间,导致无法满足在实际应用中的实时性问题。
4、综上所述,如何提升人脸识别算法的效率,并且兼顾遮挡与尺度问题使其可以对人员进行轨迹分析是现有技术亟需解决的问题。
技术实现思路
1、本技术实施例提供了一种人脸检测模型的构建方法以及轨迹分析方法,通过在骨干网络中使用位置空间注意力进行特征的提取,通过并行处理待检测行人图像的不同区域,从多维度捕捉特征之间的关联,在不增加计算量的前提下提高提取特征的质量,并且在颈部网络中通过非局部注意力机制来进行多尺度融合,改善了模型对全局信息的捕捉能力,从而提升目标检测的精度的效率。
2、第一方面,本技术实施例提供了一种人脸检测模型的构建方法,所述方法包括:
3、构建骨干网络,所述骨干网络被训练用于对待检测行人图像进行特征提取得到图像尺度依次减小的第一骨干特征图、第二骨干特征图、第三骨干特征图以及第四骨干特征图,其中,待检测行人图像为不包含标注信息的行人图像;
4、构建颈部网络,所述颈部网络被训练用于将第一骨干特征图、第二骨干特征图、第三骨干特征图以及第四骨干特征图进行多尺度融合得到第一颈部输出、第二颈部输出、第三颈部输出以及第四颈部输出,其中,先以尺度从小到大的顺序逐步将第一骨干特征图、第二骨干特征图、第三骨干特征图以及第四骨干特征图进行上采样堆叠得到第一堆叠结果、第二堆叠结果、第三堆叠结果以及第四堆叠结果,所述第四堆叠结果经过第一颈部非局部注意力机制模块得到第一颈部注意力结果,将所述第一颈部注意力结果进行卷积输出得到第一颈部输出,所述第一颈部注意力结果再与第二堆叠结果进行特征堆叠后输入至第二颈部非局部注意力机制模块中得到第二颈部注意力结果,将所述第二颈部注意力结果进行卷积输出得到第二颈部输出,所述第二颈部注意力结果再与第三堆叠结果进行特征堆叠后输入至第三颈部非局部注意力机制模块中得到第三颈部注意力结果,将所述第三颈部注意力结果进行卷积输出得到第三颈部输出,所述第三颈部注意力结果再与第四堆叠结果进行特征堆叠后输入至第四颈部非局部注意力机制模块中得到第四颈部注意力结果,将所述第四颈部注意力结果进行卷积输出得到第四颈部输出;
5、构建头部网络,所述头部网络被训练用于对第一颈部输出、第二颈部输出、第三颈部输出以及第四颈部输出进行预测得到人脸检测结果;
6、其中,所述人脸检测模型包括骨干网络、颈部网络以及头部网络,人脸检测模型在训练过程中以至少一标注有人脸位置的行人图像作 为训练样本进行训练。
7、第二方面,本技术实施例提供了一种轨迹分析方法,包括:
8、获取监控视频流,将监控视频流输入到训练好的行人检测模型中得到行人检测结果,将行人检测结果输入到人脸检测模型中得到人脸检测结果,再将人脸检测结果输入到构建好的人脸识别模型中进行人脸识别得到人脸识别结果,根据不同位置、不同时间获取的人脸识别结果来复现每一人员的行动轨迹。
9、第三方面, 本技术实施例提供了一种人脸检测模型的构建装置,包括:
10、骨干网络构建装置,用于构建骨干网络,所述骨干网络被训练用于对待检测行人图像进行特征提取得到图像尺度依次减小的第一骨干特征图、第二骨干特征图、第三骨干特征图以及第四骨干特征图,其中,待检测行人图像为不包含标注信息的行人图像;
11、颈部网络构建装置,用于构建颈部网络,所述颈部网络被训练用于将第一骨干特征图、第二骨干特征图、第三骨干特征图以及第四骨干特征图进行多尺度融合得到第一颈部输出、第二颈部输出、第三颈部输出以及第四颈部输出,其中,先以尺度从小到大的顺序逐步将第一骨干特征图、第二骨干特征图、第三骨干特征图以及第四骨干特征图进行上采样堆叠得到第一堆叠结果、第二堆叠结果、第三堆叠结果以及第四堆叠结果,所述第四堆叠结果经过第一颈部非局部注意力机制模块得到第一颈部注意力结果,将所述第一颈部注意力结果进行卷积输出得到第一颈部输出,所述第一颈部注意力结果再与第二堆叠结果进行特征堆叠后输入至第二颈部非局部注意力机制模块中得到第二颈部注意力结果,将所述第二颈部注意力结果进行卷积输出得到第二颈部输出,所述第二颈部注意力结果再与第三堆叠结果进行特征堆叠后输入至第三颈部非局部注意力机制模块中得到第三颈部注意力结果,将所述第三颈部注意力结果进行卷积输出得到第三颈部输出,所述第三颈部注意力结果再与第四堆叠结果进行特征堆叠后输入至第四颈部非局部注意力机制模块中得到第四颈部注意力结果,将所述第四颈部注意力结果进行卷积输出得到第四颈部输出;
12、头部网络构建装置,用于构建头部网络,所述头部网络被训练用于对第一颈部输出、第二颈部输出、第三颈部输出以及第四颈部输出进行预测得到人脸检测结果;其中,所述人脸检测模型包括骨干网络、颈部网络以及头部网络,人脸检测模型在训练过程中以至少一标注有人脸位置的行人图像作 为训练样本进行训练。
13、本发明的主要贡献和创新点如下:
14、本技术实施例在骨干网络中设置具有多头注意力机制与前馈神经网络的位置空间注意力增强模块,其中的多头注意力机制通过并行处理待检测行人图像的不同区域,从多维度捕捉特征间的微妙关联,实现了对待检测行人图像空间信息的全面且精准的理解,而前馈神经网络则进一步将输入特征映射至更高维度的特征空间,不仅捕捉到了特征间复杂的非线性关系,还赋予了模型学习更加多样化与深层次特征表示的能力;本方案在进行上下文提取时通过骨干网络中的多核上下文锚定注意力模块来提取不同尺度的特征,并有效的捕捉了待检测行人图像中的背景信息,并且引入了横坐标和纵坐标卷积,以捕捉长距离的上下文信息,使在面对存在遮挡的行人脸部时可以更加精准的进行检测;本方案在颈部网络中通过非局部注意力机制来进行多尺度融合,改善了模型对全局信息的捕捉能力,从而提升目标检测的精度的效率。
15、本技术的一个或多个实施例的细节在以下附图和描述中提出,以使本技术的其他特征、目的和优点更加简明易懂。
本文地址:https://www.jishuxx.com/zhuanli/20250110/353126.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表