一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于判别特征学习和熵的深度半监督图像分类方法

2022-07-23 02:15:14 来源:中国专利 TAG:

技术特征:
1.基于判别特征学习和熵的深度半监督图像分类方法,其特征在于,包括以下步骤:1)准备图像训练样本集,将训练样本集划分为有标注训练样本集和无标注训练样本集;2)搭建适用于步骤1)中图像训练样本集分类任务的深度卷积神经网络模型;3)构造判别特征学习目标函数;4)构造熵目标函数;5)结合判别特征学习目标函数和熵目标函数构造总的目标函数;6)设定当前轮次训练数的值为0;7)根据总的目标函数、当前的有标注训练样本集和无标注训练样本集,使用基于mini-batch的随机梯度下降法训练步骤2)构建的深度卷积神经网络模型直到深度卷积神经网络模型收敛;8)基于收敛的深度卷积神经网络模型,分别计算当前无标注训练样本集中每一个无标注样本属于不同类的概率;9)设定一个阈值,如果无标注样本属于不同类的概率的最大值大于阈值,给对应的无标注样本赋予概率最大值对应的类标签,将该无标注样本加入有标注训练样本集,并将该无标注样本从无标注训练样本集中去除;10)当前轮次训练数的值加1;11)重复执行步骤7)、8)、9)和10),直到当前轮次训练数达到预先设定的最大轮次训练数,得到训练好的深度卷积神经网络模型;12)将待分类的图像输入训练好的深度卷积神经网络模型,在分类层得到该图像的预测类别。2.根据权利要求1所述的基于判别特征学习和熵的深度半监督图像分类方法,其特征在于,步骤1)的具体实现方法如下:给定图像训练样本集其中,和分别表示有标注训练样本集和无标注训练样本集;x
i
表示第i个训练样本图像;如果那么是相应的类标签向量,c
i
中有且仅有一个元素为1,其余全部为0;如果x
i
含有第j类,那么c
ij
=1,否则c
ij
=0;c表示类别总数,l和u分别表示有标注和无标注训练样本的数量。3.根据权利要求2所述的基于判别特征学习和熵的深度半监督图像分类方法,其特征在于,步骤2)的具体实现方法如下:任意选择一个深度卷积神经网络模型,将该深度卷积神经网络模型最后的分类层神经元的数目设为图像训练样本集的类别总数;将所搭建网络模型的倒数第二层称为特征层,即将一张图像输入到网络,在倒数第二层的输出为该图像的特征向量。4.根据权利要求3所述的基于判别特征学习和熵的深度半监督图像分类方法,其特征在于,步骤3)的具体实现方法如下:定义x
i
(t)表示第t次迭代时样本x
i
的特征向量;在第t次迭代的mini-batch中,第c类的类内距离表示为:
其中,π
c
(t)表示第t次迭代的mini-batch中属于第c类样本的下标索引的集合;m
c
(t)表示第t次迭代时第c类的经过指数平滑更新所得到的均值向量,即其中,α表示指数平滑系数,其取值范围为0<α<1,n
c
(t)=|π
c
(t)|,即n
c
(t)表示集合π
c
(t)中元素的个数;特别地,当t=0时,总的类内距离表示为:最小化等价于增强类内紧凑性;相应地,总的类间距离表示为:最大化等价于增大类间距离;根据上面的描述,所构造的判别特征学习目标函数为:5.根据权利要求4所述的基于判别特征学习和熵的深度半监督图像分类方法,其特征在于,步骤4)的具体实现方法如下:对于第j个无标注样本图像其属于第c类的概率表示为:其中,表示的特征向量,exp(
·
)表示指数函数,‖
·
‖2表示l2范数,m
c
表示第c类的经过指数平滑更新所得到的均值向量;样本图像属于不同类的概率向量的熵为:其中,log(
·
)表示以常数e为底的对数;根据上面的描述,所构造的熵目标函数ε为:6.根据权利要求5所述的基于判别特征学习和熵的深度半监督图像分类方法,其特征
在于,步骤5)中,结合判别特征学习目标函数和熵目标函数构造总的目标函数具体为:其中,表示网络模型的层参数集合,softmax(
·
,
·
,
·
)表示softmax分类损失函数,和ε分别是判别特征学习目标函数和熵目标函数。7.根据权利要求6所述的基于判别特征学习和熵的深度半监督图像分类方法,其特征在于,步骤9)的具体实现方法如下:设定阈值为0.7,对于第j个无标注样本图像其属于第c类的概率为令如果那么就给无标注样本图像赋予第k类的类标签,将该无标注样本加入有标注训练样本集,并将该无标注样本从无标注训练样本集中去除。

技术总结
本发明公开的基于判别特征学习和熵的深度半监督图像分类方法:将训练样本集划分为有标注训练样本集和无标注训练样本集;搭建深度卷积神经网络模型;构造判别特征学习目标函数;构造熵目标函数;构造总的目标函数;设定当前轮次训练数的值为0;训练构建的网络模型直到模型收敛;基于当前网络模型,计算每一个无标注样本属于不同类的概率;更新有标注训练样本集和无标注训练样本集;当前轮次训练数的值加1;重复执行步骤7)-10),直到当前轮次训练数达到预先设定的最大轮次训练数;将待分类的图像输入训练好的网络模型,在分类层得到该图像的预测类别。该方法能够显著提高图像分类精度。度。度。


技术研发人员:石伟伟 王星 黑新宏 王晓帆 贾萌 鲁晓锋 费蓉
受保护的技术使用者:西安理工大学
技术研发日:2022.04.26
技术公布日:2022/7/22
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献