一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

一种基于深度多尺度生成对抗网络的人群计数方法

2022-12-02 22:27:17 来源:中国专利 TAG:

技术特征:
1.一种基于深度多尺度生成对抗网络的人群计数方法,其特征在于:包括如下步骤:步骤1、选取训练数据集记为train,其中包含人群图片集x和对应的真实密度图集y两部分;步骤2、设计对抗网络模型m,将m分为g和a两个模型,其中模型g是深度多尺度的全卷积模型,模型a是全连接神经网络模型;步骤3、利用训练数据train对模型m进行训练,拟合已构建的模型在训练数据l上的误差,保存最佳的g模型;步骤4、将需要预测的人群图片输入到步骤3中保存的g模型,映射出密度图并估计出人群总数。2.如权利要求1所述的基于深度多尺度生成对抗网络的人群计数方法,其特征在于:步骤2中,设人群图片集中的第k张图片为x
k
∈x,k=1,2,...,n;第i层卷积的第j个卷积核为w
ij
,则g模型的计算结果为:output=x
k
*w
ij
;g模型中包括前端卷积模型、3个卷积支路和后端卷积模型三部分。3.如权利要求2所述的基于深度多尺度生成对抗网络的人群计数方法,其特征在于:步骤2中,a模型中,包含一个自适应最大池化层,将输入的密度图调整到相同的尺寸,还包含4个全连接层,其中最后一个全连接层包含1个神经元,使用sigmoid函数进行激活,使映射结果仅包含两种情况,即真和假,其中真记作1,假记作0。4.如权利要求3所述的基于深度多尺度生成对抗网络的人群计数方法,其特征在于:步骤3中,设x
k
对应的真实密度图为y
k
∈y,k=1,2,...,n,使用训练样本集train学习深度多尺度生成对抗模型m的过程为:(1)初始化g模型和a模型的参数;(2)固定模型a的参数,将x
k
输入到模块g中映射出密度图g(x
k
),再把g(x
k
)输入到a模型中得到判别结果a(g(x
k
));将真实密度图y
k
输入到a模型中得到判别结果a(y
k
),因为此时模型a不进行学习,所以对抗损失为:l
adv
=log(1-a(g(x
k
))) loga(y
k
)(3)固定模型g的参数,g的输出直接作为a的输入,即将g和a链接为一个神经网络,记做ga模型,将x
k
输入到模型ga直接得到判别结果a(g(x
k
)),此时的映射损失为:l
gen
=loga(g(x
k
))(4)该过程中的总损失l:l=0.01l
adv
0.99l
gen
(5)迭代(2)和(3)直至参数收敛;执行完上述步骤之后,一次迭代完成,保存g模型,用于对需要预测的图片映射出密度图并估计人数。5.如权利要求4所述的基于深度多尺度生成对抗网络的人群计数方法,其特征在于:步骤3的学习过程,即卷积核w
(l)
的更新过程为梯度下降法:w
(l)
=w-λ

w
j(w)其中,λ为学习率,j(w)为损失函数,

w
j(w)表示j(w)关于w的偏导数。6.如权利要求5所述的基于深度多尺度生成对抗网络的人群计数方法,其特征在于:步
骤4具体包括利用训练好的g模型对待估计人群图片进行计数的过程是:首先将人群图x
k
输入到g模型中映射出密度图g(x
k
),然后对g(x
k
)进行积分计算出总人数n:n=∫∫
s
g(x
k
)dxdy其中s表示估计密度图的空间区域,g(x
k
)表示估计的密度图。

技术总结
本发明提供一种基于深度多尺度生成对抗网络的人群计数方法,包括如下步骤:选取训练数据集记为Train,其中包含人群图片集X和对应的真实密度图集Y两部分;设计对抗网络模型M,将M分为G和A两个模型,其中模型G是深度多尺度的全卷积模型,模型A是全连接神经网络模型;利用训练数据Train对模型M进行训练,拟合已构建的模型在训练数据L上的误差,保存最佳的G模型;将需要预测的人群图片输入到步骤3中保存的G模型,映射出密度图并估计出人群总数。本发明首先利用深度多尺度模型将人群图映射为密度图之后,又将真实的密度图与映射得到的密度图进行判别,从而进一步提高生成模型的质量和增加人数预测的准确率。增加人数预测的准确率。增加人数预测的准确率。


技术研发人员:贾富海 王锐 张东松 毛凤翔 谈敦铭 高涛
受保护的技术使用者:信阳学院
技术研发日:2022.09.05
技术公布日:2022/12/1
再多了解一些

本文用于创业者技术爱好者查询,仅供学习研究,如用于商业用途,请联系技术所有人。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献