一种残膜回收机防缠绕挑膜装置的制 一种秧草收获机用电力驱动行走机构

模型优化方法、设备和存储介质与流程

2022-02-22 20:01:44 来源:中国专利 TAG:


1.本技术涉及人工智能技术领域,尤其涉及一种模型优化方法、设备和存储介质。


背景技术:

2.随着人工智能模型的技术的不断发展,对模型的识别精度要求也越来越高。但是在某些应用场景下,可能会存在与待识别对象相似的物体,导致模型出现识别错误的现象。例如,在利用模型识别火焰的应用场景中,可能会存在电焊时的火花、玻璃反光或者环境光照等造成的干扰现象,从而导致将干扰物误识别为火焰的现象。因此,如何保证模型的识别准确性不受干扰物的影响是亟待解决的技术问题。


技术实现要素:

3.本技术提供了一种模型优化方法、设备和存储介质,旨在根据数据集中的识别错误结果信息对模型进行优化,以降低应用场景中干扰物对模型识别准确性的影响,提高模型的识别准确性。
4.第一方面,本技术实施例提供了一种模型优化方法,包括:
5.获取第一数据集,并基于所述第一数据集进行模型训练,以生成第一模型;
6.获取第二数据集,并基于所述第二数据集对所述第一模型进行推理,得到推理结果;
7.根据所述推理结果,从所述第二数据集中提取出第三数据集,所述第三数据集为所述第二数据集中识别错误的数据集;
8.分析所述第三数据集的识别错误结果信息,根据所述识别错误结果信息生成优化方案,所述优化方案用于对所述第一模型进行更新,以生成第二模型。
9.第二方面,本技术实施例提供了一种模型优化设备,其特征在于,包括存储器和处理器;
10.所述存储器用于存储计算机程序;
11.所述处理器,用于执行所述计算机程序并在执行所述计算机程序时,实现如上第一方面所述的模型优化方法的步骤。
12.第三方面,本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现如上第一方面所述的模型优化方法的步骤。
13.本技术实施例提供了一种模型优化方法、设备和存储介质,首先通过获取第一数据集,并基于所述第一数据集进行模型训练,以生成第一模型;然后获取第二数据集,并基于所述第二数据集对所述第一模型进行推理,得到推理结果;再根据所述推理结果,从所述第二数据集中提取出第三数据集,所述第三数据集为所述第二数据集中识别错误的数据集;最后分析所述第三数据集的识别错误结果信息,根据所述识别错误结果信息生成优化方案,所述优化方案用于对所述第一模型进行更新,以生成第二模型。能够根据数据集中的
识别错误结果信息生成优化方案,进而根据优化方案对模型进行优化,得到新的模型,以降低应用场景中干扰物对模型识别准确性的影响,提高模型的识别准确性。
14.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本技术实施例的公开内容。
附图说明
15.为了更清楚地说明本技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
16.图1是本技术一实施例提供的模型优化系统示意图;
17.图2是本技术实施例提供的模型优化方法应用于火焰识别场景的示意图;
18.图3是本技术一实施例提供的模型优化方法的实现流程示意图;
19.图4是识别错误结果类别的错误信息列表示意图;
20.图5是模型优化设备的显示器示意图;
21.图6是本技术另一实施例提供的模型优化方法的实现流程图;
22.图7是本技术一实施例提供的模型优化设备的示意性框图。
具体实施方式
23.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
24.附图中所示的流程图仅是示例说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解、组合或部分合并,因此实际执行的顺序有可能根据实际情况改变。
25.目前,为了提高模型的识别准确性,常采用的方法是对模型的训练样本进行各种预处理,例如进行图像清晰度处理,图像中目标对象的标注等,但是这种预处理过程常常忽略了实际应用场景中存在的干扰现象,例如在实际的应用场景中,可能存在与目标对象类似的物体或者存在使目标对象的状态发生变化的影响因素,从而使得模型出现误识别的现象。这也是当前模型出现误识别的重要原因。
26.为了解决上述技术问题,本技术实施例提供了一种模型优化方法、设备及存储介质,能够根据数据集中的识别错误结果信息生成优化方案,进而根据优化方案对模型进行优化,得到新的模型,以降低应用场景中干扰物对模型识别准确性的影响,提高模型的识别准确性。
27.请参阅图1所示,图1是本技术一实施例提供的模型优化系统示意图。本实施例提供的模型优化系统包括模型优化设备11和场景图像12。
28.其中,模型优化设备12可以是服务器或者终端设备,所述服务器可以是远程服务器、云端服务器或者服务器集群等可以用于对模型进行优化的服务器。所述终端设备可以是笔记本、pad、手持设备、机器人或者智能可穿戴设备等。所述场景图像12为对应场景下包
含有待识别的目标对象的图像。示例性地,目标对象包括但不限于当前环境中的物体如火焰、电动车辆、树木、建筑物等,也可以是目标人物或者目标动物等。
29.需要说明的是,在模型优化设备11中集成有具备模型优化的目标应用,该目标应用可以统称为模型优化系统112。
30.可以理解地,本技术实施例中所描述的模型优化方法可以适用于所有在模型优化设备11中集成模型优化系统112,通过模型优化系统112对模型进行优化的应用场景。
31.应理解,由于模型过于复杂,涉及到的运算节点及逻辑单元过多。因此,在模型优化设备11为终端设备时,若所述终端设备的计算能力较低,则该终端设备所运行的模型优化系统112可以包含提前内置的第一模型,还可以通过网络从服务器中下载第一模型。也就是说,所述终端设备运行模型优化系统112仅有用于对第一模型的优化,而对第一模型的训练过程以及对第一模型进行推理的过程可以在云端完成。在终端设备运行模型优化系统112时,云端通过网络将第一模型下发至终端设备,以减少终端设备的系统损耗,提高模型优化的效率。当然,若终端设备具有较高的模型计算能力,则可以直接运行模型优化系统112,完成对第一模型的训练以及推理过程。由此可见,在本技术实施例,还可以在云端部署具有模型训练功能以及模型推理功能的应用。其中,可以将具有模型训练功能和模型推理功能部署在同一应用内,也可以分别部署在不同的应用内。应理解,本技术实施例中所述的应用均为计算机程序。
32.其中,云端包括云数据中心和云服务平台,云数据中心包括云服务提供商拥有的大量基础资源;云数据中心包括的计算资源可以是大量的计算设备,例如服务器或者服务器集群。
33.应理解,模型优化设备11还可以包括图像采集系统111,可以通过图像采集系统111采集当前应用场景下包含有目标对象的场景图像12,并以图像采集系统111采集的场景图像12分别构成第一数据集和第二数据集;其中,图像采集系统111包括但不限于网络摄像头,该网络摄像头可以是无线网络摄像头或者有线网络摄像头,负责拍摄场景图像12,并将拍摄的场景图像12通过网络上传至模型优化设备11。
34.此外,场景图像12也可以由其它任何图像采集设备预先采集完成,并存储在预先确定的数据库113中。其中,预先确定的数据库113可以是开源数据库如关系型数据库、对象关系型数据库或者分布式数据库等。
35.以模型优化系统112为火焰模型优化系统为例,模型优化设备11可以通过火焰模型优化系统根据第一数据集进行火焰识别模型训练,以及通过第二数据集对训练后的火焰识别模型进行推理,完成对火焰识别模型的优化。
36.示例性地,如图2所示,图2是本技术实施例提供的火焰识别模型优化的场景示意图。假设当前应用场景下,模型优化设备11需要根据火焰识别模型对视频图像中的火焰进行识别,该视频图像可以是通过图像采集系统111拍摄的模拟火灾现场20的视频图像,其中,模拟的火灾现场20可以是实验室的火灾现场,舰载机的火灾现场、点火场景中引起的火灾现场、车祸场景下的火灾现场等。其中,在该应用场景下,第一模型对应为火焰识别模型,场景图像为火灾图像。需要说明的是,在实际应用中,为了降低火灾图像中干扰物对火焰识别模型的识别准确性的影响,提高火焰识别的精度,基于获取的对应应用场景下的第一数据集,训练得到第一模型,再继续对第一模型进行优化,可以有效保证模型对目标对象的识
别效率。
37.示例性地,火灾图像中可能存在的干扰物包括但不限于由于其它用户操作而导致的火花或者由于周围环境中的光照引起的光束等,例如实验室的火灾图像中可能存在由于环境光照引起的光束干扰、玻璃反光引起的光束干扰等,又如模拟点火过程引起的火灾现场时,可能会将周围环境中的火花误识别为火焰等。
38.具体地,在本实施例提供的火焰识别应用场景下,将火灾图像作为样本,构成第一数据集,根据所述第一数据集训练得到火焰识别模型,但是由于在当前应用场景下可能存在的干扰物(如图2中未示出),导致根据所述第一数据集训练得到火焰识别模型可能出现识别错误的现象。
39.例如,识别错误的现象包括将其它干扰物误识别为火焰,对火焰漏识别或者火焰位置识别错误等。其中,为了排除上述识别错误的现象,进一步地,获取第二预设数量的火灾图像,以第一预设数量的火灾图像作为样本构成第二数据集,基于所述第二数据集对所述第一模型进行推理,得到推理结果。对应地,所述推理结果包括识别错误的数据集和识别准确的数据集。其中,识别错误的数据集包括将包含有火焰的火灾图像标注为没有匹配的火焰信息的数据集、将火灾中的干扰物标注为火焰信息的数据集,或者将火灾图像中的火焰位置标注错误的数据集。
40.进一步,根据所述推理结果,从所述第二数据集中提取出第三数据集,所述第三数据集为所述第二数据集中识别错误的数据集;分析所述第三数据集的识别错误结果信息,根据所述识别错误结果信息生成优化方案,所述优化方案用于对所述第一模型进行更新,以生成第二模型。
41.其中,所述识别错误结果信息包括漏识别结果信息和误识别结果信息;漏识别结果信息为将样本中的火焰标注为非火焰信息,误识别结果信息为将样本中的其它干扰物(如火花,或者光束)标注为火焰信息,或者将样本中的火焰对应的位置信息标注错误;对应地,可以确定所述第三数据集中所有样本分别对应的识别错误结果类别,根据所识别错误结果类别中每个识别结果对应的错误标签,生成优化方案,基于生成的优化方案对第一模型进行更新,以生成第二模型。
42.其中,所述错误标签包括将火焰信息漏检的第一标签、将其它干扰物标注为火焰信息的第二标签或者将火焰的位置信息标注错误的第三标签。
43.应理解,在得到所述错误标签后,模型优化设备11可以基于所述错误标签对第三数据集中的样本进行优化。具体地,模型优化设备11可以自动化分析所述错误标签对应的样本,根据样本分析结果生成模型优化方案。也可以显示所述错误标签,以提示用户基于所述错误标签选择针对第一模型的优化方案。例如,模型优化设备11可以根据错误标签对第三数据集中的样本重新进行目标对象信息标注,例如在火焰信息漏检的样本中重新标注火焰信息等,并基于重新标注目标对象信息后的样本得到第四数据集,基于所述第四数据集对第一模型进行更新,得到能够解决上述识别错误问题的第二模型。又如,模型优化设备11显示所述错误标签后,用户基于所述错误标签选择或输入样本标签,模型优化设备11基于用户选择或输入的样本标签搜索与所述样本标签相匹配的样本,根据搜索得到的样本生成第五数据集,并基于所述第五数据集对第一模型进行更新,得到第二模型。
44.根据上述分析可知,第二模型为根据第一模型对第三数据集的分析结果对应的错
误标签,生成优化方案,对第一模型基于生成的优化方案进行优化之后得到,因此,第二模型相较于第一模型对火焰的识别精度更高。
45.上述实施例以火焰识别的应用场景对本技术提供的模型优化方法进行了示例性的说明,可以理解地,本技术实施例提供的模型优化方法不仅限于火焰识别场景,且对应的具体实现过程详见下述方法实施例中的描述。
46.请参阅图3所示,图3是本技术一实施例提供的模型优化方法的实现流程示意图。本实施例提供的模型优化方法可以由图1所示的模型优化设备执行。
47.详述如下:
48.s301,获取第一数据集,并基于所述第一数据集进行模型训练,以生成第一模型。
49.其中,第一数据集包括训练样本数据。示例性地,所述训练样本数据可以预先存储在数据库中,也可以在目标应用场景下由图像采集系统采集得到。随着目标应用场景的不同,对应的样本数据也不同。例如,在本实施例中,收集一组包含有不同形态火焰的图像作为样本数据,包含有不同形态火焰的图像中可能存在不同的干扰物,例如火花、环境光照产生的反射、太阳光束等。
50.第一模型为基于所述第一数据集训练得到的用于对目标应用场景下的目标对象进行识别的第一模型。所述第一模型可以是如神经网络模型、决策树模型或者随机森林模型等。
51.s302,获取第二数据集,并基于所述第二数据集对所述第一模型进行推理,得到推理结果。
52.其中,第二数据集包括测试样本数据。应理解,样本数据包括测试样本数据和训练样本数据,且测试样本数据和训练样本数据具有一定的比例,如,训练样本数据占所有样本数据的70%,测试样本数据占所有样本数据的30%。
53.在一些实施例中,所述获取第二数据集,并基于所述第二数据集对所述第一模型进行推理,得到推理结果,包括:获取所述第二数据集中所有样本包括的第一目标标记信息,所述第一目标标记信息由所述第一模型对所述第二数据集进行推理后,标记得到;将所述第一标记信息与所述第二数据集中各样本对应预设的第二目标标记信息进行比对,得到所述推理结果。
54.其中,第一目标标记信息是第一模型对样本进行识别时,对应标注的目标对象信息,包括目标对象的类别和位置信息。
55.其中,目标对象的类别可以由预设的标识信息进行表示。其中,预设的标识信息包括字符、字母、数字或者字符与字母、数字的任意组合;位置信息常以位置框进行表示。
56.例如常将目标对象标识为1,非目标对象标识为0,常用矩形框表示位置框等。
57.应理解,由于第二数据集包括的是测试样本数据,将第二数据集输入第一模型后,第一模型会对所有测试样本包含的目标对象进行标注,形成目标对象标注框并在所述目标对象标注框得处显示预设的标识信息,例如预设的标识信息为1,代表目标对象标注框内的是目标对象。以所述目标对象标注框和所述标识信息组成所述第一目标标记信息。
58.第二目标标记信息为预先对第二样本数据集中的各样本包含的目标对象进行标注得到的预标记信息。应理解,第二目标标记信息与第一目标标记信息的格式相同,包括目标对象标注框和预设标识信息。
59.其中,所述推理结果包括识别错误的结果信息和识别正确的结果信息;所述识别错误的结果信息包括漏标注目标对象、目标对象类别标注错误或者目标对象位置标注错误。
60.所述将所述第一标记信息与所述第二数据集中各样本对应预设的第二目标标记信息进行比对,包括:获取第一样本对应的第一目标标记信息和第二目标标记信息,将所述第一标记信息对应的第一目标对象类别与第二标记信息对应的第二目标对象类别进行比对,将所述第一标记信息对应的第一位置框与所述第二标记信息对应的第二位置框进行比对;若所述第一目标对象类别与所述第二目标对象类别相同,且所述第一位置框与所述第二位置框在所述第一样本中的位置相同,且所述第一位置框与所述第二位置框重合,则确定所述推理结果为识别正确的结果信息;若所述第一目标对象类别与所述第二目标对象类别不相同、所述第一位置框与所述第二位置框在所述第一样本中的位置不相同,或所述第一位置框与所述第二位置框不重合,则确定所述推理结果为识别错误的结果信息。
61.由于模型对样本的识别结果即包括类别识别结果和位置识别结果,因此,需要将类别识别结果和位置识别结果分别进行比对,来提高推理结果的准确性。
62.在一些实施例中,所述将所述第一标记信息与所述第二数据集中各样本对应预设的第二目标标记信息进行比对,得到所述推理结果,包括:将所述第一目标标记信息与所述第二目标标记信息通过预设的准确率检测算法进行相似性比对,得到所述识别错误的结果信息和所述识别正确的结果信息。
63.其中,预设的准确率检测算法包括但不限于基于直方图的相似性检测算法、余弦相似性算法、时序相似性算法等。
64.示例性地,以基于直方图的相似性检测算法为例进行说明。
65.应理解,通过预设的准确率检测算法进行相似性比对是基于第一目标标记信息和第二目标标记信息标记的目标对象类别相同的前提。也就是说,所述第一目标标记信息包括第一目标对象类别和第一位置框,所述第二目标标记信息包括第二目标对象类别和第二位置框;所述将所述第一目标标记信息与所述第二目标标记信息通过预设的准确率检测算法进行相似性比对,得到所述识别错误的结果信息和所述识别正确的结果信息,包括:确定所述第一目标对象类别与所述第二目标对象类别相同,则将所述第一位置框与所述第二位置框通过预设的准确率检测算法进行相似性比对,得到所述识别错误的结果信息和所述识别正确的结果信息。对应地,该识别错误的结果信息为位置识别错误的结果信息。
66.具体地,分别提取所述第一位置框对应的第一区域信息和所述第二位置框对应的第二区域信息;计算所述第一区域信息和所述第二区域信息的直方图相似性特征值;若所述直方图相似性特征值大于预设的直方图相似性阈值,则得到所述识别正确的结果信息;若所述第一区域信息和所述第二区域信息的所述直方图相似性特征值小于或等于预设的直方图相似性阈值,则得到所述识别错误的结果信息。
67.在本实施例中,计算所述第一区域信息和所述第二区域信息的直方图相似性特征值所采用的公式如下:
[0068][0069]
其中,φ1表示第一区域,φ2表示第二区域,x表示第一区域φ1中像素的灰度值,要表示第二区域φ2种像素的灰度值,n表示第一区域φ1和第二区域φ2中总的像素个数。
[0070]
应理解,当确定所述第一目标对象类别与所述第二目标对象类别不相同是,则直接得到所述识别错误的结果信息。对应地,该识别错误的结果信息为类别识别错误的结果信息。
[0071]
本实施例在对位置识别错误的推理过程中,引入准确率检测算法,能够提高位置识别错误的推理效率。
[0072]
s303,根据所述推理结果,从所述第二数据集中提取出第三数据集,所述第三数据集为所述第二数据集中识别错误的数据集。
[0073]
示例性地,根据所述识别错误的结果信息,从所述第二数据集中提取出所有识别错误结果对应的样本,基于提取的样本构成所述第三数据集。
[0074]
s304,分析所述第三数据集的识别错误结果信息,根据所述识别错误结果信息生成优化方案,所述优化方案用于对所述第一模型进行更新,以生成第二模型。
[0075]
其中,所述识别错误结果信息对应有不同错误类别,例如漏检类别或者误检类别,且导致不同错误类别的原因可能不同,不同错误类别包括有不同错误列表信息。
[0076]
在一些实施例中,分析所述第三数据集的识别错误结果信息,根据所述识别错误的结果信息生成优化方案,包括:确定所述第三数据集中所有样本分别对应的识别错误结果类别;其中,所述识别错误结果类别中的每个识别结果对应有错误信息列表,所述错误信息列表中包括至少一个错误标签;根据所述错误信息列表中的所述错误标签,生成所述优化方案。
[0077]
示例性地,如图4所示,图4是识别错误结果类别的错误信息列表示意图。所述识别错误结果类别41中的每个识别结果410对应有错误信息列表411,所述错误信息列表411中包括至少一个错误标签412;根据所述错误信息列表411中的所述错误标签412,生成所述优化方案。
[0078]
其中,错误信息列表记录了生成错误结果的原因,每个原因对应为所述错误信息列表中的一个列表项,如目标对象与背景颜色相似、存在与目标对象相似的干扰物、目标对象光照不足等。
[0079]
所述错误标签对应用于解释识别错误结果,例如识别错误结果为漏检,对应的错误标签为没有匹配到目标对象;又如识别错误结果为误识别,对应的错误标签为类别识别错误,或者类别识别准确但是位置识别错误等。
[0080]
所述识别错误结果由样本中的多个原因造成,不同的识别错误结果类别造成的原因可能不同,例如,造成误识别结果的原因可能是对目标对象的位置标注错误,或者目标对象与背景图像之间存在相似物;又如造成漏识别的原因可能是对目标对象没有进行标注等,因此需要生成用于解释造成识别错误结果的错误信息列表,并在错误信息列表中以错
误标签解释识别错误结果,从而有利于准确地对错误原因进行追溯,基于错误原因对样本针对性地进行优化。能够有效提高对第一模型识别结果错误的原因的分析效率,生成较准确的优化方案。
[0081]
在一些实施例中,所述根据所述错误信息列表中的所述错误标签,生成所述优化方案,包括:从所述第三数据集中分别获取所述错误信息列表中的每个所述错误标签对应的样本;对获取的所述样本基于所述错误标签重新进行目标对象信息标注,根据重新标注后的样本生成第四数据集;基于所述第四数据集对所述第一模型进行更新,以生成所述第二模型。
[0082]
例如,所述第三数据集中的第一样本对应的错误标签为没有匹配到目标对象,则对所述第一样本重新进行目标对象信息标注。应理解,目标对象信息包括目标对象类别和目标对象位置信息。示例性地,可以以预设字符或者数字等标识符标识目标对象类别,以矩形框、正方形等特殊框图标识目标对象位置信息。
[0083]
又如,所述第三数据集中的第二样本对应的错误标签为类别识别错误,则对所述第二样本重新进行目标对象信息的类别标注。又如,所述第三数据集中的第三样本对应的错误标签为类别识别正确但是位置识别错误,则对所述第三样本重新进行目标位置信息标注。
[0084]
由于样本中标注的目标对象信息是影响模型识别准确性的关键因素。因此,有必要根据模型识别错误结果对应的错误标签,对样本中的目标对象信息进行重新标注,并基于重新标注的样本生成对应的训练集,对模型进行更新,可以有效提高模型识别的准确性。
[0085]
在一些实施例中,所述根据所述错误信息列表中的所述错误标签,生成所述优化方案,包括:显示所述错误信息列表,响应于用户基于所述错误信息列表输入或选择的样本标签,基于所述样本标签搜索与所述样本标签相匹配的样本,根据搜索得到的样本生成第五数据集;基于所述第五数据集对所述第一模型进行更新,以生成所述第二模型。
[0086]
应理解,所述样本标签与所述错误信息列表中的错误标签位相反的标签,例如错误标签为没有匹配到目标对象,则用户可以基于该错误标签输入目标对象信息标注完整的样本标签,基于该样本标签搜索预先存储的样本,得到对应目标对象信息标注完整的样本。由于错误标签不具有唯一性,且不同错误标签对应的样本比例以及对模型准确性的影响均不同,因此,将错误信息列表进行显示,使用户基于错误信息列表中的错误标签分别选择或输入样本标签,能够有效获取到与每个错误标签相反的样本标签对应的样本,保证能够搜索到所有用户输入或选择的样本标签下的样本,进而基于搜索到的样本对第一模型进行更新,得到具有较高识别准确性的第二模型。
[0087]
示例性地,如图5所示,图5是模型优化设备的显示器的示意图。由图5可知,模型优化设备11还可以包括显示器114,对应地,模型优化设备11可以在所述显示器114上显示错误信息。其中,所述显示器114可以是触摸屏幕显示器、液晶显示器、薄膜晶体管ldc(tft-lcd)显示器、有机发光二极管(oled)显示器、柔性显示器、三维(3d)显示器中的至少一种。错误信息可以显示在显示器114的第一区域1141中,第一区域1141与用于供用户输入标签信息的输入单元1142可以位于相邻的区域。其中,输入单元1142用于供用户输入错误信息对应的标签信息,由图5可知,在本实施例中,输入单元1142可以位于与第一区域1141相邻的任意位置,且输入单元1142不限于一个,对应如图4所示,包括两个输入单元1142,应理
解,图5仅是示例性地说明,具体不构成对显示器114的限制。示例性地,输入单元1142可以供用户通过任何预设的输入方式输入对应的标签信息,例如预设的输入方式包括触控方式或者语音方式。可选地,输入单元1142还可以包括多个标签信息的下拉菜单或者选择项(图中未示出),用户可以通过下拉菜单或者选择项选择对应的标签信息。
[0088]
对应地,在模型优化设备11中预先存储有与所述错误信息的标签信息相匹配的样本,模型优化设备11响应于用户输入的标签信息,基于所述标签信息遍历预先存储的样本,搜索到与所述错误信息相对应的样本,获搜索到的样本,生成第五数据集。
[0089]
此外,所述显示器114还可以包括供用户触发模型优化操作的控件、按钮等(图5中未示出),对应在所述显示器114上显示所述推理结果后,若用户基于显示器114上的控件或者按钮等触发模型优化操作,响应于用户基于所述推理结果触发的模型优化操作指令,基于所述模型优化操作指令分析所述第三数据集的识别错误结果信息,根据所述识别错误结果信息生成所述优化方案。
[0090]
应理解,基于优化方案对所述第一模型进行更新,以生成第二模型的过程,实际上是基于新的数据集对所述第一模型进行重新训练的过程,在对第一模型进行重新训练过程中,根据所述第一模型的损失函数的变化,判断第一模型的收敛度。
[0091]
具体地,可以根据所述第一模型的损失函数值与预设收敛阈值之间的关系,确定对所述第一模型的训练过程是否完成,对所述第一模型的训练过程完成后,得到所述第二模型。
[0092]
应理解,由于所述识别错误的结果信息包括类别识别错误的结果信息、位置识别错误的结果信息、类别和位置均识别错误的结果信息中的至少之一。当所述推理结果为识别错误的结果信息,且所述识别错误的结果信息包括类别识别错误的结果信息、位置识别错误的结果信息以及类别和位置均识别错误的结果信息时,为了保证对模型的优化效率,可以选择包含有较优样本的其它数据集对第三模型进行优化。因此,在基于所述第二数据集对所述第一模型进行推理,得到推理结果后,还可以通过显示所述推理结果,以提示用户基于所述推理结果确定是否需要基于所述推理结果从第二数据集中选取所述第三数据集对所述第一模型进行优化。若用户基于所述推理结果触发对模型的优化操作指令,则基于所述模型优化操作指令分析所述第三数据集的识别错误结果信息,根据所述识别错误结果信息生成所述优化方案。
[0093]
通过上述分析可知,本技术实施例提供的模型优化方法,通过获取第一数据集,并基于所述第一数据集进行模型训练,以生成第一模型;然后获取第二数据集,并基于所述第二数据集对所述第一模型进行推理,得到推理结果;再根据所述推理结果,从所述第二数据集中提取出第三数据集,所述第三数据集为所述第二数据集中识别错误的数据集;最后分析所述第三数据集的识别错误结果信息,根据所述识别错误结果信息生成优化方案,所述优化方案用于对所述第一模型进行更新,以生成第二模型。能够根据数据集中的识别错误结果信息生成优化方案,进而根据优化方案对模型进行优化,得到新的模型,以降低应用场景中干扰物对模型识别准确性的影响,提高模型的识别准确性。
[0094]
请参阅图6所示,图6是本技术另一实施例提供的模型优化方法的实现流程图。需要说明的是,本实施例与图3所示实施例相比,s601至s603与s301至s303的具体实现过程相同,不同之处在于,在s603之后还包括s604至s606,且s606的具体实现过程与s304的具体实
现过程不同。详述如下:
[0095]
s601,获取第一数据集,并基于所述第一数据集进行模型训练,以生成第一模型。
[0096]
s602,获取第二数据集,并基于所述第二数据集对所述第一模型进行推理,得到推理结果。
[0097]
s603,根据所述推理结果,从所述第二数据集中提取出第三数据集,所述第三数据集为所述第二数据集中识别错误的数据集。
[0098]
s604,分别获取所述第一数据集的第一参数信息和所述第二数据集的第二参数信息。
[0099]
其中,所述第一参数信息为第一数据集中样本对应的抽象场景信息,第二参数信息为第二数据集中样本对应的抽象场景信息。所述抽象场景信息包括获取样本时对应的样本场景信息。例如,样本图像的像素范围值、拍摄样本图像的光线强度值、拍摄样本图像的摄像头角度值、拍摄样本图像的摄像头高度值、样本图像中目标对象的位置、目标对象的数量、目标对象的密集度、目标对象的清晰度等。
[0100]
s605,基于所述第一参数信息和所述第二参数信息,获取目标数据集,所述目标数据集对应的目标参数信息与所述第一参数信息和所述第二参数信息的相似度均大于预设相似度阈值。
[0101]
应理解,第一数据集中的样本和所述第二数据集中的样本可以是同一时间段拍摄的样本图像,也可以是不同时间段拍摄的样本图像,或者部分是同一时间段拍摄的样本图像,部分是不同时间段拍摄的样本图像。无论是同一时间段拍摄的样本图像或者是不同时间段拍摄的样本图像,第一数据集中的样本和第二数据集中的样本都可能存在第一参数信息和第二参数信息相差较大的现象。
[0102]
在本实施例中,分别将所述第一参数信息和第二参数信息中的各个场景信息进行归类,得到第一参数列表和第二参数列表;基于余弦相似度算法计算所述第一参数列表中各第一参数与预设数据库各样本对应的目标参数之间的第一相似度,以及所述第二参数列表中各第二参数与预设数据库中各样本对应的目标参数之间的第二相似度;分别将计算得到的各第一相似度以及各第二相似度与预设相似度阈值进行比较,根据比较结果,获取第一相似度和第二相似度均大于预设相似度阈值的样本,构成所述目标数据。
[0103]
其中,预设数据库中各样本的目标参数的类别对应与第一参数列表和第二参数列表中各参数的类别一致。
[0104]
余弦相似度算法可以表示为:
[0105][0106]
其中,d表示第一参数列表中第i参数与第i个目标参数之间的相似度,xi表示第一参数列表中的第i个参数,yi表示第i个目标参数,n为参数的数量;或者,d表示第二参数列表中第i参数与第i个目标参数之间的相似度,xi表示第二参数列表中的第i个参数。
[0107]
s606,基于所述目标数据集对所述第一模型进行更新,以生成所述第二模型。
[0108]
应理解,对所述第一模型进行更新的过程,实际上是基于目标数据集对所述第一模型进行重新训练的过程,在对第一模型进行重新训练过程中,根据所述第一模型的损失
函数的变化,判断第一模型的收敛度,具体地,可以根据所述第一模型的损失函数值与预设收敛阈值之间的关系,确定对所述第一模型的训练过程是否完成,对所述第一模型的训练过程完成后,得到所述第二模型。
[0109]
通过上述分析可知,本技术实施例提供的模型优化方法,通过获取第一数据集,并基于所述第一数据集进行模型训练,以生成第一模型;然后获取第二数据集,并基于所述第二数据集对所述第一模型进行推理,得到推理结果;再根据所述推理结果,获取与所述第一数据集和所述第二数据集的参数信息均相似的目标数据集,基于所述目标数据对所述第一模型进行更新,以生成第二模型。能够根据第一模型对测试数据集的识别错误结果信息,获取与训练数据集和测试数据集均相似的目标数据集,基于目标数据集对第一模型进行更新,得到具有较高识别精度的第二模型,以降低应用场景中干扰物对模型识别准确性的影响,提高模型的识别准确性。
[0110]
请参阅图7所示,图7是本技术一实施例提供的模型优化设备的示意性框图。示例性的,模型优化设备11可以是服务器或者终端设备,其中所述服务器可以是云端服务器、远程服务器或者服务器集群等,所述终端设备包括但不限于手机、平板电脑、笔记本电脑、台式电脑、个人数字助理和穿戴式设备等。
[0111]
所述模型优化设备11包括处理器701和存储器702。
[0112]
示例性的,处理器701和存储器702通过总线703连接,所述总线703比如为i2c(inter-integrated circuit)总线。
[0113]
具体地,处理器701可以是微控制单元(micro-controller unit,mcu)、中央处理单元(central processing unit,cpu)或数字信号处理器(digital signal processor,dsp)等。
[0114]
具体地,存储器702可以是flash芯片、只读存储器(rom,read-only memory)磁盘、光盘、u盘或移动硬盘等。
[0115]
其中,所述处理器701用于运行存储在存储器702中的计算机程序,并在执行所述计算机程序时实现上述模型优化方法的步骤。
[0116]
示例性的,所述处理器701用于运行存储在存储器702中的计算机程序,并在执行所述计算机程序时实现如下步骤:
[0117]
获取第一数据集,并基于所述第一数据集进行模型训练,以生成第一模型;
[0118]
获取第二数据集,并基于所述第二数据集对所述第一模型进行推理,得到推理结果;
[0119]
根据所述推理结果,从所述第二数据集中提取出第三数据集,所述第三数据集为所述第二数据集中识别错误的数据集;
[0120]
分析所述第三数据集的识别错误结果信息,根据所述识别错误结果信息生成优化方案,所述优化方案用于对所述第一模型进行更新,以生成第二模型。
[0121]
在一些实施例中,所述分析所述第三数据集的识别错误结果信息,根据所述识别错误的结果信息生成优化方案,包括:
[0122]
确定所述第三数据集中所有样本分别对应的识别错误结果类别,其中,所述识别错误结果类别中的每个识别结果对应有错误信息列表,所述错误信息列表中包括至少一个错误标签;
[0123]
根据所述错误信息列表中的所述错误标签,生成所述优化方案。
[0124]
在一些实施例中,所述根据所述错误信息列表中的所述错误标签,生成所述优化方案,包括:
[0125]
从所述第三数据集中分别获取所述错误信息列表中的每个所述错误标签对应的样本;
[0126]
对获取的所述样本基于所述错误标签重新进行目标对象信息标注,根据重新标注后的样本生成第四数据集;
[0127]
基于所述第四数据集对所述第一模型进行更新,以生成所述第二模型。
[0128]
在一些实施例中,所述根据所述错误信息列表中的所述错误标签,生成所述优化方案,包括:
[0129]
显示所述错误信息列表,响应于用户基于所述错误信息列表输入或选择的样本标签,基于所述样本标签搜索与所述样本标签相匹配的样本,根据搜索得到的样本生成第五数据集;
[0130]
基于所述第五数据集对所述第一模型进行更新,以生成所述第二模型。
[0131]
在一些实施例中,在所述获取第二数据集,并基于所述第二数据集对所述第一模型进行推理,得到推理结果之后,还包括:
[0132]
分别获取所述第一数据集的第一参数信息和所述第二数据集的第二参数信息;
[0133]
基于所述第一参数信息和所述第二参数信息,获取目标数据集,所述目标数据集对应的目标参数信息与所述第一参数信息和所述第二参数信息的相似度均大于预设相似度阈值;
[0134]
基于所述目标数据集对所述第一模型进行更新,以生成所述第二模型。
[0135]
在一些实施例中,在所述根据所述推理结果,从所述第二数据集中提取出第三数据集之后,还包括:
[0136]
显示所述推理结果,响应于用户基于所述推理结果触发的模型优化操作指令;
[0137]
对应地,所述分析所述第三数据集的识别错误结果信息,根据所述识别错误结果信息生成优化方案,包括:
[0138]
基于所述模型优化操作指令分析所述第三数据集的识别错误结果信息,根据所述识别错误结果信息生成所述优化方案。
[0139]
在一些实施例中,所述获取第二数据集,并基于所述第二数据集对所述第一模型进行推理,得到推理结果,包括:
[0140]
获取所述第二数据集中所有样本包括的第一目标标记信息,所述第一目标标记信息由所述第一模型对所述第二数据集进行推理后,标记得到;
[0141]
将所述第一标记信息与所述第二数据集中各样本对应预设的第二目标标记信息进行比对,得到所述推理结果。
[0142]
在一些实施例中,所述推理结果包括识别错误的结果信息和识别正确的结果信息;所述将所述第一标记信息与所述第二数据集中各样本对应预设的第二目标标记信息进行比对,得到所述推理结果,包括:
[0143]
将所述第一目标标记信息与所述第二目标标记信息通过预设的准确率检测算法进行相似性比对,得到所述识别错误的结果信息和所述识别正确的结果信息。
[0144]
本技术实施例提供的模型优化设备的具体原理和实现方式均与前述实施例的模型优化方法类似,此处不再赘述。
[0145]
本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现上述实施例提供的模型优化方法的步骤。
[0146]
其中,所述计算机可读存储介质可以是前述任一实施例所述的模型优化设备的内部存储单元,例如所述模型优化设备的硬盘或内存。所述计算机可读存储介质也可以是所述模型优化设备的外部存储设备,例如所述模型优化设备上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。
[0147]
应当理解,在此本技术中所使用的术语仅仅是出于描述特定实施例的目的而并不意在限制本技术。
[0148]
还应当理解,在本技术和所附权利要求书中使用的术语“和/或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合。
[0149]
以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应以权利要求的保护范围为准。
再多了解一些

本文用于企业家、创业者技术爱好者查询,结果仅供参考。

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表

相关文献