一种基于深度多尺度生成对抗网络的人群计数方法

2022-12-02 22:27:17 来源：中国专利 TAG：

技术特征：
1.一种基于深度多尺度生成对抗网络的人群计数方法，其特征在于：包括如下步骤：步骤1、选取训练数据集记为train，其中包含人群图片集x和对应的真实密度图集y两部分；步骤2、设计对抗网络模型m，将m分为g和a两个模型，其中模型g是深度多尺度的全卷积模型，模型a是全连接神经网络模型；步骤3、利用训练数据train对模型m进行训练，拟合已构建的模型在训练数据l上的误差，保存最佳的g模型；步骤4、将需要预测的人群图片输入到步骤3中保存的g模型，映射出密度图并估计出人群总数。2.如权利要求1所述的基于深度多尺度生成对抗网络的人群计数方法，其特征在于：步骤2中，设人群图片集中的第k张图片为x
k
∈x，k＝1,2,...,n；第i层卷积的第j个卷积核为w
ij
，则g模型的计算结果为：output＝x
k
*w
ij
；g模型中包括前端卷积模型、3个卷积支路和后端卷积模型三部分。3.如权利要求2所述的基于深度多尺度生成对抗网络的人群计数方法，其特征在于：步骤2中，a模型中，包含一个自适应最大池化层，将输入的密度图调整到相同的尺寸，还包含4个全连接层，其中最后一个全连接层包含1个神经元，使用sigmoid函数进行激活，使映射结果仅包含两种情况，即真和假，其中真记作1，假记作0。4.如权利要求3所述的基于深度多尺度生成对抗网络的人群计数方法，其特征在于：步骤3中，设x
k
对应的真实密度图为y
k
∈y，k＝1,2,...,n，使用训练样本集train学习深度多尺度生成对抗模型m的过程为：(1)初始化g模型和a模型的参数；(2)固定模型a的参数，将x
k
输入到模块g中映射出密度图g(x
k
)，再把g(x
k
)输入到a模型中得到判别结果a(g(x
k
))；将真实密度图y
k
输入到a模型中得到判别结果a(y
k
)，因为此时模型a不进行学习，所以对抗损失为：l
adv
＝log(1-a(g(x
k
))) loga(y
k
)(3)固定模型g的参数，g的输出直接作为a的输入，即将g和a链接为一个神经网络，记做ga模型，将x
k
输入到模型ga直接得到判别结果a(g(x
k
))，此时的映射损失为：l
gen
＝loga(g(x
k
))(4)该过程中的总损失l：l＝0.01l
adv
0.99l
gen
(5)迭代(2)和(3)直至参数收敛；执行完上述步骤之后，一次迭代完成，保存g模型，用于对需要预测的图片映射出密度图并估计人数。5.如权利要求4所述的基于深度多尺度生成对抗网络的人群计数方法，其特征在于：步骤3的学习过程，即卷积核w
(l)
的更新过程为梯度下降法：w
(l)
＝w-λ
▽
w
j(w)其中，λ为学习率，j(w)为损失函数，
▽
w
j(w)表示j(w)关于w的偏导数。6.如权利要求5所述的基于深度多尺度生成对抗网络的人群计数方法，其特征在于：步
骤4具体包括利用训练好的g模型对待估计人群图片进行计数的过程是：首先将人群图x
k
输入到g模型中映射出密度图g(x
k
)，然后对g(x
k
)进行积分计算出总人数n：n＝∫∫
s
g(x
k
)dxdy其中s表示估计密度图的空间区域，g(x
k
)表示估计的密度图。

技术总结
本发明提供一种基于深度多尺度生成对抗网络的人群计数方法，包括如下步骤：选取训练数据集记为Train，其中包含人群图片集X和对应的真实密度图集Y两部分；设计对抗网络模型M，将M分为G和A两个模型，其中模型G是深度多尺度的全卷积模型，模型A是全连接神经网络模型；利用训练数据Train对模型M进行训练，拟合已构建的模型在训练数据L上的误差，保存最佳的G模型；将需要预测的人群图片输入到步骤3中保存的G模型，映射出密度图并估计出人群总数。本发明首先利用深度多尺度模型将人群图映射为密度图之后，又将真实的密度图与映射得到的密度图进行判别，从而进一步提高生成模型的质量和增加人数预测的准确率。增加人数预测的准确率。增加人数预测的准确率。

技术研发人员：贾富海王锐张东松毛凤翔谈敦铭高涛
受保护的技术使用者：信阳学院
技术研发日：2022.09.05
技术公布日：2022/12/1

再多了解一些

2/2 首页上一页 1 2

本文用于创业者技术爱好者查询，仅供学习研究，如用于商业用途，请联系技术所有人。

上一篇：返回列表
下一篇：文本相似度识别方法、装置、设备及存储介质与流程

一种基于深度多尺度生成对抗网络的人群计数方法

相关文献

最热文献