一种面向图像区域多标注的标签融合生成方法
- 国知局
- 2024-10-09 16:05:00
本发明涉及计算机视觉,特别是指一种面向图像区域多标注的标签融合生成方法。
背景技术:
1、在计算机视觉和图像处理领域,图像标注是一项关键任务,其质量直接影响到后续模型训练和性能表现。现有的图像标注方法和技术主要包括手动标注和半自动化标注,具体如区域强标注、矩形框标注、椭圆标注、旋转矩形框标注、旋转椭圆标注等。这些方法在实际应用中存在以下几个主要技术问题:
2、不同标注者由于经验、理解和主观判断的差异,往往会对同一图像产生不同的标注结果。这些差异会导致标注数据的不一致性,进而影响训练模型的准确性和鲁棒性。
3、图像标注任务中常涉及多种标注类型(如区域强标注、矩形框标注等),而现有技术通常仅支持单一类型的标注。这种局限性使得不同类型标注信息难以综合利用,从而限制了模型在处理复杂场景时的性能。
4、由于标注者的主观性,不同标注者对同一图像的标注结果可能存在显著偏差。单一标注者的标注结果容易受到其个人理解和能力的影响,从而引入潜在的标注偏差,影响训练数据的质量。
5、在多标注者和多标注类型的情况下,如何有效地融合不同来源和不同类型的标注信息,以生成统一的高质量标注结果,是一个复杂且尚未解决的技术难题。现有技术在处理多标注信息融合时,往往缺乏系统性的方法,导致信息融合效果不佳。
6、图像标注中存在的不确定性(如边界模糊、标注者信心不足等)在现有方法中通常未得到充分处理。这种不确定性会影响标注结果的可靠性,进而对模型训练和推理产生负面影响。
7、现有标注方法大多依赖人工操作,自动化程度低,效率不高。在大规模图像数据集的标注任务中,这种低效的标注方式无法满足快速生成高质量标注数据的需求。
8、大规模图像数据集的标注通常需要大量的人力和时间,成本高昂。现有技术缺乏有效的方法来降低标注成本,同时确保标注数据的质量和一致性。
9、综上所述,现有图像标注技术在一致性、准确性、多样性融合、偏差处理、不确定性处理、自动化程度和标注成本等方面存在诸多问题和挑战,这些问题直接影响到后续模型的训练效果和性能。针对这些问题,亟需一种新的方法来实现更高效、更可靠的图像标注信息融合,提升模型的性能和应用效果。
技术实现思路
1、为了解决现有技术中图像标注的一致性、准确性、多样性融合、不确定性处理、自动化程度和标注成本等的技术问题,本发明提供了一种面向图像区域多标注的标签融合生成方法。
2、本发明提供的技术方案如下:
3、第一方面:
4、本发明提供的一种面向图像区域多标注的标签融合生成方法,包括:
5、s1、构建标注评估数据集,所述标注评估数据集包括原始图像和不同标签类型的标注,标注评估数据集构建完成后,由标注者对所述标注评估数据集进行不同标签类型的标注;
6、s2、通过中智信息刻画计算每个所述标注者每种所述标签类型的标注能力,中智信息刻画方法分别计算每个所述标注者每种所述标签类型的中智隶属度、不确定性度和非隶属度,方法如下:
7、
8、其中, t为所述标注者标注标签的中智隶属度, i为不确定性度, f为非隶属度,用于计算像素点集合的总像素点数,和分别为第 i张图像所述标注者标注标签区域内像素点集合,对应所述标注者标注标签的标准标注标签区域内像素点集合;
9、s3、计算图像各像素点中智度量同理想选择之间的距离量度,所述理想选择为:
10、
11、其中,为理想中智隶属度,为理想不确定性度,为理想非隶属度,所述中智度量的计算方法如下:
12、
13、其中, d为中智度量,为正定矩阵的最大非负特征值的开方, n为中智度量参考属性总数,式中各矩阵计算方法如下:
14、
15、其中,函数为严格单调二元函数,、和分别为基于第 i种设定属性的中智隶属度、不确定性度和非隶属度,上式将中智隶属度、不确定性度和非隶属度相关的距离度量平等看待;
16、s4、通过中智度量计算中智度量强度作为每个所述标注者每种所述标签类型的可信度:
17、
18、其中, p为中智度量强度, d为中智度量,所述中智度量强度为中智不确定信息刻画经融合后的中智刻画图 x处的强度,所述中智距离度量为 x处的中智距离度量;
19、s5、由所述标注者对除所述标注评估数据集以外的一张图像进行多种所述标签类型的标注,计算得到标签概率图 x处的中智隶属度 t、不确定性度 i和非隶属度 f,计算方法如下:
20、
21、其中,k为图像关联的标注标签总数,以所述中智度量强度为第 i个标签对应的标签可信度,标签可信度对应所述标注者标注此类标签的能力可信度,为标签在 x处的掩膜值, x位于标签标记区域内时为1,否则为0,l为对应标签标记区域的像素点集合;
22、s6、通过s4计算得到标签概率图 x处的强度值,对图像中每个像素点均完成计算后,即得到该图像经标签融合后生成的标签概率图,所述标签概率图与原影像作为训练图像和参照标签供模型训练使用;
23、s7、对每张图像完成标注,并计算得到相应的所述标签概率图,即可完成多人多标注融合数据集,供模型训练使用。
24、本发明提供的技术方案带来的有益效果至少包括:
25、(1)在本发明中,通过融合来自不同标注者和不同标注类型的标签信息,该方法能有效减小单一标注者和单一标签类型带来的偏差,生成更为一致和准确的标签概率图,从而提升模型训练的效果和性能;
26、(2)在本发明中,综合利用区域强标注、矩形框标注、椭圆标注等多种标注类型的信息,有助于模型在处理复杂和多变的图像场景时,提供更全面的特征描述,进而提高模型在各种实际应用中的适应能力和准确性;
27、(3)在本发明中,通过自动化融合不同来源和类型的标注数据,减少了对大量人工标注的依赖,降低了标注成本,并加快了数据处理速度,提高了大规模图像数据集标注的效率和可扩展性。
技术特征:1.一种面向图像区域多标注的标签融合生成方法,其特征在于,包括:
2.根据权利要求1所述的一种面向图像区域多标注的标签融合生成方法,其特征在于,所述s2具体包括:
3.根据权利要求1所述的一种面向图像区域多标注的标签融合生成方法,其特征在于,所述s3中中智度量具体包括:
4.根据权利要求1所述的一种面向图像区域多标注的标签融合生成方法,其特征在于,所述s4中的具体方法包括:
5.根据权利要求1所述的一种面向图像区域多标注的标签融合生成方法,其特征在于,所述s5中的计算方法具体包括:
6.根据权利要求1所述的一种面向图像区域多标注的标签融合生成方法,其特征在于,包括:
7.根据权利要求1所述的一种面向图像区域多标注的标签融合生成方法,其特征在于,包括:
8.根据权利要求3所述的一种面向图像区域多标注的标签融合生成方法,其特征在于,所述s3具体包括:
9.根据权利要求3所述的一种面向图像区域多标注的标签融合生成方法,其特征在于,所述s3具体包括:
10.根据权利要求5所述的一种面向图像区域多标注的标签融合生成方法,其特征在于,所述s5具体包括:
技术总结本发明提供一种面向图像区域多标注的标签融合生成方法,涉及计算机视觉技术领域。该方法以同一张图像的多个标注标签图像为输入,这些标签可能源自不同标注者且包括区域强标注、矩形框标注、椭圆标注等多种类型。方法首先构建标注评估数据集,并对每个标注者进行能力评估。通过中智信息刻画,计算每个标注者的标注能力,包括隶属度、不确定性度和非隶属度。接着,计算图像各像素点的标签概率图,融合不同标注信息生成最终标签概率图。该标签概率图可用于模型训练时的损失计算,有效降低标注偏差,提升模型的性能和泛化能力。此方法通过多源标注信息融合,优化了图像标注的准确性,并增强了模型训练的鲁棒性。技术研发人员:胡珂立,陈慧灵,王臣,赵利平,祝汉灿,吴宗大,胡剑浩,李琪,周洁受保护的技术使用者:绍兴文理学院技术研发日:技术公布日:2024/9/26本文地址:https://www.jishuxx.com/zhuanli/20240929/311594.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 YYfuon@163.com 举报,一经查实,本站将立刻删除。
下一篇
返回列表