一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

基于深度学习的图像数据标注系统及其方法与流程

2022-06-12 02:38:04 来源:中国专利 TAG:

技术特征:
1.一种基于深度学习的图像数据标注系统,其特征在于,包括:聚类模块,用于对输入的样本图像进行聚类,基于聚类挑选出待标注启动数据,其中所述待标注启动数据在标注后作为小样本深度学习模块的输入数据;小样本深度学习模块,用于接收标注后的启动数据,对深度学习模型进行训练;交互模块,用于抽样获取所述深度学习模型的标识结果,通过交互界面确认所述深度学习模型的识别精度,并根据所述深度学习模型的识别精度启动半监督训练模块对所述深度学习模型进行循环训练;半监督训练模块,用于基于上一轮训练的所述深度学习模型,获取未标注的所述样本图像的预测标注框,对所述预测标注框进行筛选,并根据筛选出的所述预测标注框对所述深度学习模型进行迭代更新。2.根据权利要求1所述的基于深度学习的图像数据标注系统,其特征在于,所述聚类模块包括:特征聚类模块,用于提取所述样本图像的特征图,对所述样本图像的图像特征进行降维并聚类,得到聚类簇;挑选模块,用于根据业务需求确定挑选策略,基于所挑选策略从所述聚类簇中选取若干所述样本图像,作为所述待标注启动数据。3.根据权利要求1所述的基于深度学习的图像数据标注系统,其特征在于,所述小样本深度学习模块包括:图像金字塔生成模块,用于接收标注好的启动数据,剪裁出正样本目标,对所述正样本目标进行多尺度缩放,生成多尺度图像金字塔;训练模块,用于接收标注好的启动数据以及相应的所述多尺度图像金字塔,输入所述深度学习模型进行迭代训练。4.根据权利要求1所述的基于深度学习的图像数据标注系统,其特征在于,所述半监督训练模块包括:训练数据挑选模块,用于基于上一轮训练的所述深度学习模型,对未标注的所述样本图像进行预测,选取置信度在预设阈值以上的预测框作为所述样本图像的标注,作为本轮训练输入的样本标注图像,以对所述深度学习模型进行迭代更新。5.根据权利要求1所述的基于深度学习的图像数据标注系统,其特征在于,还包括:数据清洗模块,用于对输入的图像数据进行清洗,去除损坏图像及重复图像,筛选出符合预设图像规格的所述样本图像。6.一种基于深度学习的图像数据标注方法,其特征在于,包括以下步骤:对输入的样本图像进行聚类,基于聚类挑选出待标注启动数据,其中所述待标注启动数据用以标注,作为深度学习模型训练的输入数据;接收标注后的启动数据,对所述深度学习模型进行训练;抽样获取所述深度学习模型的标识结果,通过交互界面确认所述深度学习模型的识别精度;根据所述深度学习模型的识别精度对所述深度学习模型进行半监督循环训练;所述半监督循环训练中,基于上一轮训练的所述深度学习模型,获取未标注的所述样本图像的预测标注框,对所述预测标注框进行筛选,并根据筛选出的所述预测标注框对所述深度学习
模型进行迭代更新。7.根据权利要求6所述的基于深度学习的图像数据标注方法,其特征在于,所述对输入的样本图像进行聚类,基于聚类挑选出待标注启动数据包括:提取所述样本图像的特征图,对所述样本图像的图像特征进行降维并聚类,得到聚类簇;根据业务需求确定挑选策略,基于所述挑选策略,从所述聚类簇中选取距离所述聚类中心一定阈值范围内的所述样本图像或从所述聚类簇中随机选取若干所述样本图像,作为所述待标注启动数据。8.根据权利要求6所述的基于深度学习的图像数据标注方法,其特征在于,所述接收标注后的启动数据,对所述深度学习模型进行训练包括:接收标注好的启动数据,剪裁出正样本目标,对所述正样本目标进行多尺度缩放,生成多尺度图像金字塔;接收标注好的启动数据以及相应的所述多尺度图像金字塔,输入所述深度学习模型进行迭代训练。9.根据权利要求6所述的基于深度学习的图像数据标注方法,其特征在于,所述半监督循环训练包括:基于上一轮训练的所述深度学习模型,对未标注的所述样本图像进行预测,选取置信度在预设阈值以上的预测框作为所述样本图像的标注,作为本轮训练输入的样本标注图像;获取输入的所述样本标注图像的多尺度图像金字塔,分别进行第一数据处理和第二数据处理后,输入至所述深度学习模型,得到相应的第一预测标签和第二预测标签;比对所述第一预测标签和第二预测标签,计算相应的损失函数,对所述深度学习模型进行迭代更新。10.一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现权利要求6至9中任一项的方法。

技术总结
本发明公开了基于深度学习的图像数据标注系统及方法,该系统包括:聚类模块,用于基于聚类挑选出待标注启动数据,其中待标注启动数据在标注后作为小样本深度学习模块的输入数据;小样本深度学习模块,用于接收标注后的启动数据,对深度学习模型进行训练;交互模块,用于抽样获取深度学习模型的标识结果,根据深度学习模型的识别精度启动半监督训练模块对深度学习模型进行循环训练;半监督训练模块,用于获取未标注的样本图像的预测标注框,对预测标注框进行筛选,并根据筛选出的预测标注框对深度学习模型进行迭代更新。本发明可以通过较少的启动标注数据对算法模型进行训练,获得实际可用的高质量批注结果,大幅地降低了标注成本。本。本。


技术研发人员:钟成 周颖婕 邓星 张泽熙
受保护的技术使用者:珠高智能科技(深圳)有限公司
技术研发日:2022.01.24
技术公布日:2022/6/10
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献