一种无监督的行人重识别方法、系统、装置及存储介质

2022-07-31 00:26:39 来源：中国专利 TAG：

1.本技术涉及计算机视觉技术领域，尤其是一种无监督的行人重识别方法、系统、装置及存储介质。

背景技术：

2.行人重识别(re-id)是一种跨非重叠摄像机的行人检索技术。简单来说，行人重识别的目标是在给定查询对象的前提下，确定行人是否被处在另一个地方的另一个摄像机在另一个时间拍摄到。一般情况下，查询对象可以是图像、视频序列以及文字描述。由于不同摄像机的拍摄画面在视点、图像分辨率、照明变化，行人的姿态、遮挡以及模态等方面不尽相同，行人重识别成为了一项极具挑战性的任务。
3.传统的行人重识别根据训练样本是否有标注可以分为有监督和无监督两个方向。其中，在有标注的样本上进行行人重识别模型训练的是有监督行人重识别，而在无标注的样本上进行行人重识别模型训练的则是无监督行人重识别。显然，无监督行人重识别相较于有监督行人重识别难度更高，也更接近于实际情况。
4.无监督行人重识别的模型学习方法主要包括域自适应方法和纯无监督方法。其中，在域自适应方法中，模型在有标注的源域数据集上进行训练，然后再迁移至新的无标注的数据集上进行进一步的训练；而纯无监督方法利用聚类或者图匹配等方法为目标数据打上伪标签，直接在目标域数据集上进行模型训练。由于纯无监督方法难度较高，技术尚不成熟，在实际应用中大多采用域自适应方法进行模型学习。然而，域自适应方法存在有步骤繁琐的缺点。并且随着对模型精度要求的提升，域自适应方法受源域数据集的影响和限制越来越明显。

技术实现要素：

5.本发明的目的在于至少一定程度上解决现有技术中存在的技术问题之一。
6.为此，本发明实施例的一个目的在于提供一种无监督的行人重识别方法、系统、装置及存储介质，以实现高精度的、识别准确的无监督的行人重识别。
7.为了达到上述技术目的，本发明实施例所采取的技术方案包括：
8.第一方面，本发明实施例提供了一种无监督的行人重识别方法，包括以下步骤：
9.从imagenet数据集中获取第一行人数据，所述第一行人数据包括多张第一行人图片和对应的第一图片信息，所述第一图片信息包括对应的所述第一行人图片的拍摄设备信息；
10.根据所述第一行人图片进行特征提取，生成第一行人特征；
11.根据所述第一图片信息对所述第一行人特征进行分组，生成第一特征组；
12.根据所述第一特征组初始化第一记忆字典；
13.根据所述第一记忆字典调整所述第一行人特征的特征间距，生成第二行人特征；
14.根据所述第二行人特征初始化第二记忆字典；
15.根据所述第一记忆字典和所述第二记忆字典构建联合记忆学习模型；
16.根据所述联合记忆学习模型和第二行人数据进行网络训练，得到行人重识别网络，所述第二行人数据为输入的训练集数据；
17.采用所述行人重识别网络对待识别的行人数据进行识别，得到行人识别结果。
18.本发明实施例的一种无监督的行人重识别方法，通过对行人数据进行特征提取、特征分类以及类内的特征聚类进行第一记忆字典的初始化，再基于第一记忆字典的特征间距调整初始化第二记忆字典，然后根据第一记忆字典和第二记忆字典构建联合记忆学习模型，并以此训练行人重识别网络，实现了纯无监督的模型学习及网络训练，使得行人重识别网络的行人识别效果不受拍摄设备的影响，提高了行人识别的精确度以及对各种拍摄场景的适应性。
19.另外，根据本发明上述实施例的一种无监督的行人重识别方法，还可以具有以下附加的技术特征：
20.进一步地，本发明实施例的一种无监督的行人重识别方法中，所述根据所述第一行人图片进行特征提取，生成第一行人特征，包括：
21.根据行人检测算法对所述第一行人图片进行行人检测，生成行人标定框；
22.通过所述行人标定框切割所述第一行人图片，生成第二行人图片；
23.通过特征提取网络对所述第二行人图片进行特征提取，生成所述第一行人特征。
24.进一步地，在本发明的一个实施例中，所述根据所述第一特征组初始化第一记忆字典，包括：
25.对每个所述第一特征组内的所述第一行人特征进行聚类，生成第一特征类，所述第一特征类中包括第三行人特征，所述第三行人特征包括所述第一行人特征和对应的伪标签；
26.对每个所述第一特征类内的所述第三行人特征取平均，生成第四行人特征，所述第四行人特征为所述第一特征类的特征表示；
27.根据所述第四行人特征构建所述第一记忆字典。
28.进一步地，在本发明的一个实施例中，所述根据所述第一记忆字典调整所述第一行人特征的特征间距，生成第二行人特征，包括：
29.对所述第一行人特征与所述第四行人特征进行相似度计算，得到第一相似度；
30.根据所述第一相似度生成相似度分布；
31.根据所述相似度分布调整所述第一行人特征的特征间距，生成所述第二行人特征。
32.进一步地，在本发明的一个实施例中，所述根据所述第二行人特征初始化第二记忆字典，包括：
33.对所述第二行人特征进行聚类，生成第二特征类，所述第二特征类中包括第五行人特征，所述第五行人特征包括所述第二行人特征和对应的伪标签；
34.对每个所述第二特征类内的所述第五行人特征取平均，生成第六行人特征，所述第六行人特征为所述第二特征类的特征表示；
35.根据所述第六行人特征构建所述第二记忆字典。
36.进一步地，在本发明的一个实施例中，所述第二行人数据包括多张第三行人图片
和对应的第二图片信息，所述第二图片信息包括对应的所述第三行人图片的拍摄设备信息；
37.所述根据所述联合记忆学习模型和第二行人数据进行网络训练，得到行人重识别网络，包括：
38.根据所述第三行人图片进行特征提取，生成第七行人特征；
39.将所述第七行人特征分别与所述第四行人特征、所述第六行人特征进行相似度计算，得到第二相似度；
40.根据所述第二相似度的最大值，从所述第四行人特征和所述第六行人特征获取第八行人特征；
41.根据所述第四行人特征、所述第六行人特征、所述第七行人特征和所述第八行人特征进行损失计算，更新所述第一记忆字典和所述第二记忆字典，并返回根据所述第三行人图片进行特征提取，生成第七行人特征这一步骤。
42.进一步地，在本发明的一个实施例中，所述待识别的行人数据包括第四行人图片和对应的第三图片信息，所述第三图片信息包括对应的所述第三行人图片的拍摄设备信息，所述行人重识别网络识别后的行人特征保存在服务器中；
43.所述采用所述行人重识别网络对待识别的行人数据进行识别，得到行人识别结果，包括：
44.从所述待识别的行人数据中提取第九行人特征；
45.对所述第九行人特征与所述服务器中的行人特征进行相似度计算，得到第三相似度；
46.从所述第三相似度中得到第四相似度，所述第四相似度为所述第三相似度中的最大值；
47.判断所述第四相似度是否大于预设的阈值；
48.若是，将所述第九行人特征与第一行人标签匹配，生成所述行人识别结果并显示，所述第一行人标签为与第十行人特征对应的行人标签，所述第十行人特征为所述服务器中与所述第九行人特征相似度最高的行人特征；
49.若否，将所述第九行人特征与第二行人标签匹配，生成所述行人识别结果并显示，所述第二行人标签为新设置行人标签。
50.第二方面，本发明实施例提出了一种无监督的行人重识别系统，包括：
51.行人数据获取模块，用于从imagenet数据集中获取第一行人数据，所述第一行人数据包括多张第一行人图片和对应的第一图片信息；
52.特征提取模块，用于根据所述第一行人图片进行特征提取，生成第一行人特征；
53.特征分组模块，用于根据所述第一图片信息对所述第一行人特征进行分组，生成第一特征组；
54.第一记忆字典初始化模块，用于根据所述第一特征组初始化第一记忆字典；
55.特征间距调整模块，用于根据所述第一记忆字典调整所述第一行人特征的特征间距，生成第二行人特征；
56.第二记忆字典初始化模块，用于根据所述第二行人特征初始化第二记忆字典；
57.模型构建模块，用于根据所述第一记忆字典和所述第二记忆字典构建联合记忆学
习模型；
58.网络训练模块，用于根据所述联合记忆学习模型和第二行人数据进行网络训练，得到行人重识别网络，所述第二行人数据为输入的训练集数据；
59.行人识别模块，用于采用所述行人重识别网络对待识别的行人数据进行识别，得到行人识别结果。
60.第三方面，本发明实施例提供了一种无监督的行人重识别装置，包括：
61.至少一个处理器；
62.至少一个存储器，用于存储至少一个程序；
63.当所述至少一个程序被所述至少一个处理器执行时，使得所述至少一个处理器实现所述的一种无监督的行人重识别方法。
64.第四方面，本发明实施例提供了一种存储介质，其中存储有处理器可执行的程序，所述处理器可执行的程序在由处理器执行时用于实现所述的一种无监督的行人重识别方法。
65.本发明的优点和有益效果将在下面的描述中部分给出，部分将从下面的描述中变得明显，或通过本技术的实践了解到：
66.本发明实施例通过对行人数据进行特征提取、特征分类以及类内的特征聚类进行第一记忆字典的初始化，再基于第一记忆字典的特征间距调整初始化第二记忆字典，然后根据第一记忆字典和第二记忆字典构建联合记忆学习模型，并以此训练行人重识别网络，实现了纯无监督的模型学习及网络训练，使得行人重识别网络的行人识别效果不受拍摄设备的影响，提高了行人识别的精确度以及对各种拍摄场景的适应性。
附图说明
67.为了更清楚地说明本技术实施例或者现有技术中的技术方案，下面对本技术实施例或者现有技术中的相关技术方案附图作以下介绍，应当理解的是，下面介绍中的附图仅仅为了方便清晰表述本技术的技术方案中的部分实施例，对于本领域的技术人员来说，在无需付出创造性劳动的前提下，还可以根据这些附图获取到其他附图。
68.图1为本发明一种无监督的行人重识别方法具体实施例的流程示意图；
69.图2为本发明一种无监督的行人重识别方法具体实施例的联合记忆学习模型示意图；
70.图3为本发明一种无监督的行人重识别系统具体实施例的结构示意图；
71.图4为本发明一种无监督的行人重识别装置具体实施例的结构示意图。
具体实施方式
72.下面详细描述本发明的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，仅用于解释本技术，而不能理解为对本技术的限制。对于以下实施例中的步骤编号，其仅为了便于阐述说明而设置，对步骤之间的顺序不做任何限定，实施例中的各步骤的执行顺序均可根据本领域技术人员的理解来进行适应性调整。
73.本发明的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第
四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。
74.在本发明中提及“实施例”意味着，结合实施例描述的特定特征、结构或特性可以包含在本发明的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。
75.行人重识别是一种跨非重叠摄像机的行人检索技术。简单来说，行人重识别的目标是在给定查询对象的前提下，确定行人是否被处在另一个地方的另一个摄像机在另一个时间拍摄到。一般情况下，查询对象可以是图像、视频序列以及文字描述。由于不同摄像机的拍摄画面在视点、图像分辨率、照明变化，行人的姿态、遮挡以及模态等方面不尽相同，行人重识别成为了一项极具挑战性的任务。
76.传统的行人重识别根据训练样本是否有标注可以分为有监督和无监督两个方向。其中，在有标注的样本上进行行人重识别模型训练的是有监督行人重识别，而在无标注的样本上进行行人重识别模型训练的则是无监督行人重识别。显然，无监督行人重识别相较于有监督行人重识别难度更高，也更接近于实际情况。
77.无监督行人重识别的模型学习方法主要包括域自适应方法和纯无监督方法。其中，在域自适应方法中，模型在有标注的源域数据集上进行训练，然后再迁移至新的无标注的数据集上进行进一步的训练；而纯无监督方法利用聚类或者图匹配等方法为目标数据打上伪标签，直接在目标域数据集上进行模型训练。由于纯无监督方法难度较高，技术尚不成熟，在实际应用中大多采用域自适应方法进行模型学习。然而，域自适应方法存在有步骤繁琐的缺点。并且随着对模型精度要求的提升，域自适应方法受源域数据集的影响和限制越来越明显。
78.为此，本发明提出了一种无监督的行人重识别方法和系统，不同于传统的行人重识别方法存在因域自适应方法导致的模型精度低以及受拍摄设备影响和限制的问题，本发明通过对行人数据进行特征提取、特征分类以及类内的特征聚类进行第一记忆字典的初始化，再基于第一记忆字典的特征间距调整初始化第二记忆字典，然后根据第一记忆字典和第二记忆字典构建联合记忆学习模型，并以此训练行人重识别网络，实现了纯无监督的模型学习及网络训练，使得行人重识别网络的行人识别效果不受拍摄设备的影响，提高了行人识别的精确度以及对各种拍摄场景的适应性。
79.下面参照附图详细描述根据本发明实施例提出的一种无监督的行人重识别方法和系统，首先将参照附图描述根据本发明实施例提出的一种无监督的行人重识别方法。
80.参照图1，本发明实施例中提供一种无监督的行人重识别方法，本发明实施例中的一种无监督的行人重识别方法，可应用于终端中，也可应用于服务器中，还可以是运行于终端或服务器中的软件等。终端可以是平板电脑、笔记本电脑、台式计算机等，但并不局限于此。服务器可以是独立的物理服务器，也可以是多个物理服务器构成的服务器集群或者分布式系统，还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(cdn)、以及大数据和人工智能平台等基础云
计算服务的云服务器。本发明实施例中的一种无监督的行人重识别方法主要包括以下步骤：
81.s101、从imagenet数据集中获取第一行人数据；
82.其中，所述第一行人数据包括多张第一行人图片和对应的第一图片信息，所述第一图片信息包括对应的所述第一行人图片的拍摄设备信息。
83.具体地，在输入采集的行人图片进行行人重识别训练之前，先利用imagenet数据集中的第一行人数据进行预训练。
84.s102、根据所述第一行人图片进行特征提取，生成第一行人特征；
85.具体地，采用resnet50作为骨干网络提取步骤s101中获取的第一行人数据中第一行人图片对应的行人特征。在本发明的一个实施例中，直接下载已公开的在imagenet数据集中预训练过的resnet50网络权重文件进行resnet50的配置。其中，所述第一行人特征是维度为2048的特征向量。
86.本发明实施例采用的边缘计算盒子的算力较强，通过边缘计算盒子部署人工智能算法实现了硬件加速，满足了行人重识别实时性的要求。
87.s102可以进一步划分为以下步骤s1021-s1023：
88.步骤s1021、根据行人检测算法对所述第一行人图片进行行人检测，生成行人标定框；
89.其中，本发明实施例通过边缘计算盒子对第一行人图片进行行人检测。
90.具体地，对每一张单帧的行人图片(第一行人图片)进行处理，采用yolov5行人检测模型检测图片中行人的数量、位置和大小，并根据行人的数量、位置和大小生成行人标定框，将图片中的单个行人进行标定。
91.步骤s1022、通过所述行人标定框切割所述第一行人图片，生成第二行人图片；
92.具体地，获取步骤s1021中行人标定框的坐标、宽度和高度，根据行人标定框的坐标、宽度和高度将单个行人的图片切割出来，生成第二行人图片。可以理解的是，第二行人图片中只包含一个行人，并且行人占据第二行人图片中的大部分空间。
93.步骤s1023、通过特征提取网络对所述第二行人图片进行特征提取，生成所述第一行人特征。
94.具体地，在本发明的一个实施例中，先将第二行人图片调整为宽为128、高为256的rbg图片。然后输入到特征提取网络(训练好的resnet50)中，输出维度为2048的特征向量，即所述第一行人特征。
95.s103、根据所述第一图片信息对所述第一行人特征进行分组，生成第一特征组；
96.具体地，参照图2，根据各个第一行人特征对应的第一行人图片的拍摄设备信息(第一图片信息)对第一行人特征进行分组，生成第一特征组。
97.s104、根据所述第一特征组初始化第一记忆字典；
98.具体地，本发明实施例的第一记忆字典(memory-cam)通过将输入的所有行人图片按照拍摄设备信息(如摄像头id)进行分类，再对类内进行聚类提取聚类级别特征完成构建。
99.s104可以进一步划分为以下步骤s1041-s1043：
100.步骤s1041、对每个所述第一特征组内的所述第一行人特征进行聚类，生成第一特
征类；
101.其中，所述第一特征类中包括第三行人特征，所述第三行人特征包括所述第一行人特征和对应的伪标签。
102.具体地，对所述第一特征类中的所有第一行人特征采用dbscan聚类方法进行聚类，给每个所述第一行人特征打上伪标签。
103.步骤s1042、对每个所述第一特征类内的所述第三行人特征取平均，生成第四行人特征；
104.其中，所述第四行人特征为所述第一特征类的特征表示。
105.具体地，对每个所述第一特征类中的第三行人特征进行取平均操作，生成每个所述第一特征类的聚类级别特征，即所述第四行人特征。
106.步骤s1043、根据所述第四行人特征构建所述第一记忆字典。
107.具体地，根据聚类级别特征，即所述第四行人特征，构建第一记忆字典(memory-cam)，完成所述第一记忆字典的初始化。
108.s105、根据所述第一记忆字典调整所述第一行人特征的特征间距，生成第二行人特征；
109.在本发明的实施例中，在所述第一记忆字典和第二记忆字典的初始化过程中结合了特征距离重计算。
110.s105可以进一步划分为以下步骤s1051-s1053：
111.步骤s1051、对所述第一行人特征与所述第四行人特征进行相似度计算，得到第一相似度；
112.具体地，采用相似度计算公式分别计算各个所述第一行人特征与各个所述第四行人特征的相似度，得到所述第一相似度：
113.sim(fm,fn)＝(fm·fn
)/(‖fm‖
×
‖fn‖) 1
114.其中，fm表示步骤s1023生成的所述第一行人特征，fn表示步骤s1032生成的所述第四行人特征。
115.步骤s1052、根据所述第一相似度生成相似度分布；
116.具体地，根据步骤s1051可知，通过相似度计算公式对每个所述第一行人特征和每个所述第四行人特征的相似度进行计算，得到一系列的所述第一相似度。根据一系列的所述第一相似度组成相似度分布。
117.步骤s1053、根据所述相似度分布调整所述第一行人特征的特征间距，生成所述第二行人特征。
118.具体地，在本发明的实施例中，若两个行人特征的相似度分布接近，则认为这两个行人特征来自于同一行人的概率较大。通过以下公式计算两个行人特征的相似度分布的相似度：
119.sim(sm,sn)＝(sm∩sn)/(sm∪sn)
120.其中，sm∩sn表示两个行人特征(向量对应元素)的最小值之和，sm∪sn表示两个行人特征(向量对应元素)的最大值之和。利用sim(sm,sn)调整所述第一行人特征的特征间距，生成所述第二行人特征：
121.d(im,in)＝d(fm,fn) μ(1-sim(sm,sn))
122.其中，μ为超参数，通常取值为0.02。
123.s106、根据所述第二行人特征初始化第二记忆字典；
124.具体地，本发明实施例的第二记忆字典(memory-all)通过将输入的所有行人图片进行聚类提取聚类级别特征完成构建。
125.s106可以进一步划分为以下步骤s1061-s1063：
126.步骤s1061、对所述第二行人特征进行聚类，生成第二特征类；
127.其中，所述第二特征类中包括第五行人特征，所述第五行人特征包括所述第二行人特征和对应的伪标签。
128.具体地，对所述第二特征类中的所有的第二行人特征采用dbscan聚类方法进行聚类，给每个所述第二行人特征打上伪标签。
129.步骤s1062、对每个所述第二特征类内的所述第五行人特征取平均，生成第六行人特征；
130.其中，所述第六行人特征为所述第二特征类的特征表示。
131.具体地，对每个所述第二特征类中的第五行人特征进行取平均操作，生成每个所述第二特征类的聚类级别特征，即所述第六行人特征。
132.步骤s1063、根据所述第六行人特征构建所述第二记忆字典。
133.具体地，根据聚类级别特征，即所述第六行人特征，构建第二记忆字典(memory-all)，完成所述第二记忆字典的初始化。
134.s107、根据所述第一记忆字典和所述第二记忆字典构建联合记忆学习模型；
135.具体地，根据步骤s104构建的第一记忆字典(memory-cam)和步骤s106构建的第二记忆字典(memory-all)构建联合记忆学习模型。
136.s108、根据所述联合记忆学习模型和第二行人数据进行网络训练，得到行人重识别网络；
137.其中，所述第二行人数据为输入的训练集数据。可以理解的是，所述第二行人数据包括多张第三行人图片和对应的第二图片信息，所述第二图片信息包括对应的所述第三行人图片的拍摄设备信息。
138.s108可以进一步划分为以下步骤s1081-s1084：
139.步骤s1081、根据所述第三行人图片进行特征提取，生成第七行人特征；
140.具体地，在本发明的实施例中，对所述第三行人图片进行抽样，抽取64张第三行人图片，通过特征提取网络(训练好的resnet50)提取出64个第七行人特征。
141.步骤s1082、将所述第七行人特征分别与所述第四行人特征、所述第六行人特征进行相似度计算，得到第二相似度；
142.具体地，参照步骤s1041，通过相似度计算公式计算各个所述第七行人特征与各个所述第四行人特征、各个所述第六行人特征的相似度，得到所述第二相似度。
143.步骤s1083、根据所述第二相似度的最大值，从所述第四行人特征和所述第六行人特征获取第八行人特征；
144.具体地，从所述第二相似度中提取最大值，并获取与第二相似度的最大值相对应的行人特征，得到所述第四行人特征和所述第六行人特征中与所述第七行人特征最相似的行人特征，即所述第八行人特征。
145.步骤s1084、根据所述第四行人特征、所述第六行人特征、所述第七行人特征和所述第八行人特征进行损失计算，更新所述第一记忆字典和所述第二记忆字典，并返回步骤s1081。
146.具体地，损失计算：
[0147][0148]
其中，q表示所述第七行人特征，c

表示所述第八行人特征，ci表示所述第四行人特征和所述第六行人特征。本发明实施例对第一记忆字典和第二记忆字典中对比出的损失进行相加，通过反向传播更新网络。具体地，主要更新第一记忆字典和第二记忆字典中与新提取的行人特征最接近的行人特征，即所述第八行人特征(与所述第七行人特征最接近)：
[0149]c
＝m
·c
(1-m)
·q[0150]
其中，m为超参数，通常取值为0.1。在本发明的实施例中，第一记忆字典比对储存的同一拍摄设备的一组行人特征，第二记忆字典比对储存的所有行人特征。
[0151]
步骤s1084结束后，返回步骤s1081。本发明实施例的步骤s1081-s1084为一次网络训练迭代过程。对于每一个epoch，需要进行200次所述网络迭代过程。在本发明的实施例中，步骤s102-s108为一个epoch，步骤s102-s107为联合记忆学习模型构建(行人重识别网络预训练)过程，步骤s108为采用联合记忆学习模型和训练数据进行行人重识别网络训练的过程。本发明实施例的行人重识别网络整个训练过程需要执行100个epochs。设置初始学习率为3.5e-4，每40个epochs将学习率削减为原来的1/10。
[0152]
本发明实施例的行人重识别网络通过map、rank-1、rank-5、rank-10指标评定行人重识别效果。
[0153]
s109、采用所述行人重识别网络对待识别的行人数据进行识别，得到行人识别结果。
[0154]
其中，所述待识别的行人数据包括第四行人图片和对应的第三图片信息，所述第三图片信息包括对应的所述第三行人图片的拍摄设备信息，所述行人重识别网络识别后的行人特征保存在服务器中。
[0155]
参照步骤s101-s108，s109可以进一步划分为以下步骤s1091-s1096：
[0156]
步骤s1091、从所述待识别的行人数据中提取第九行人特征；
[0157]
具体地，通过边缘计算盒子对不同拍摄设备拍摄的各个方位和视角的行人照片(所述第四行人图片)进行处理，利用yolov5行人检测模型检测出第四行人图片中出现行人的数量，位置以及大小，并根据行人的数量、位置和大小生成行人标定框，将第四行人图片中的单个行人进行标定。根据行人标定框的坐标、宽度和高度将单个行人的图片切割出来，并通过resnet50提取切割后的行人图片的特征，得到所述第九行人特征。
[0158]
步骤s1092、对所述第九行人特征与所述服务器中的行人特征进行相似度计算，得到第三相似度；
[0159]
具体地，根据相似度计算公式，将所述第九行人特征与服务器中存储的所述行人重识别网络识别后的行人特征进行相似度计算，得到所述第三相似度。
[0160]
步骤s1093、从所述第三相似度中得到第四相似度，所述第四相似度为所述第三相似度中的最大值；
[0161]
步骤s1094、判断所述第四相似度是否大于预设的阈值；
[0162]
步骤s1095、若是，将所述第九行人特征与第一行人标签匹配，生成所述行人识别结果并显示；
[0163]
其中，所述第一行人标签为与第十行人特征对应的行人标签，所述第十行人特征为所述服务器中与所述第九行人特征相似度最高的行人特征。
[0164]
步骤s1096、若否，将所述第九行人特征与第二行人标签匹配，生成所述行人识别结果并显示。
[0165]
其中，所述第二行人标签为新设置行人标签。
[0166]
具体地，当所述第四相似度小于预设的阈值时，给所述第九行人特征贴上新的新人标签。
[0167]
可以理解的是，完成待识别的行人数据的识别后，将行人识别结果存储到服务器中，用于后续的行人重识别，以及联合记忆学习模型和行人重识别网络的训练和优化。
[0168]
在本发明的实施例中，采用单独的计算机通过网络链接处理服务器来显示，以实现方便的远程监控。具有以下功能：
[0169]
第一，应查看系统中任意拍摄设备所拍摄的实时画面，并将行人标定框标示在实时画面中。
[0170]
第二，实时查看最新的若干张单一行人图片，并将行人标签标注在图片下。
[0171]
第三，调取保存的拍摄视频。
[0172]
第四，修改单一行人图片的标签，将某一张行人图片的标签修改为另外的标签，即进行人为的标注。
[0173]
第五，统一地修改某一行人的标签名称，将所有标有同一行人标签的图片标签修改为人名或其他任何方便使用者辨别行人身份的名称。可以理解的是，若两个行人被修改为同一名称，则在存储时视为同一行人。
[0174]
第六，利用服务器中存储的行人图片，通过步骤s108在服务器的gpu上训练行人重识别网络。进一步地，在系统中同时储存有多个重识别网络权重文件，由使用者随时决定实际应用哪一个。
[0175]
根据步骤s101-s109可知，本发明通过对行人数据进行特征提取、特征分类以及类内的特征聚类进行第一记忆字典的初始化，再基于第一记忆字典的特征间距调整初始化第二记忆字典，然后根据第一记忆字典和第二记忆字典构建联合记忆学习模型，并以此训练行人重识别网络，实现了纯无监督的模型学习及网络训练，使得行人重识别网络的行人识别效果不受拍摄设备的影响，提高了行人识别的精确度以及对各种拍摄场景的适应性。
[0176]
其次，参照附图描述根据本技术实施例提出的一种无监督的行人重识别系统。
[0177]
图3是本技术一个实施例的一种无监督的行人重识别系统结构示意图。
[0178]
所述系统具体包括：
[0179]
行人数据获取模块301，用于从imagenet数据集中获取第一行人数据，所述第一行人数据包括多张第一行人图片和对应的第一图片信息；
[0180]
特征提取模块302，用于根据所述第一行人图片进行特征提取，生成第一行人特征；
[0181]
特征分组模块303，用于根据所述第一图片信息对所述第一行人特征进行分组，生
成第一特征组；
[0182]
第一记忆字典初始化模块304，用于根据所述第一特征组初始化第一记忆字典；
[0183]
特征间距调整模块305，用于根据所述第一记忆字典调整所述第一行人特征的特征间距，生成第二行人特征；
[0184]
第二记忆字典初始化模块306，用于根据所述第二行人特征初始化第二记忆字典；
[0185]
模型构建模块307，用于根据所述第一记忆字典和所述第二记忆字典构建联合记忆学习模型；
[0186]
网络训练模块308，用于根据所述联合记忆学习模型和第二行人数据进行网络训练，得到行人重识别网络，所述第二行人数据为输入的训练集数据；
[0187]
行人识别模块309，用于采用所述行人重识别网络对待识别的行人数据进行识别，得到行人识别结果。
[0188]
可见，上述方法实施例中的内容均适用于本系统实施例中，本系统实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0189]
参照图4，本技术实施例提供了一种无监督的行人重识别装置，包括：
[0190]
至少一个处理器401；
[0191]
至少一个存储器402，用于存储至少一个程序；
[0192]
当所述至少一个程序被所述至少一个处理器401执行时，使得所述至少一个处理器401实现所述的一种无监督的行人重识别方法。
[0193]
同理，上述方法实施例中的内容均适用于本装置实施例中，本装置实施例所具体实现的功能与上述方法实施例相同，并且达到的有益效果与上述方法实施例所达到的有益效果也相同。
[0194]
在一些可选择的实施例中，在方框图中提到的功能/操作可以不按照操作示图提到的顺序发生。例如，取决于所涉及的功能/操作，连续示出的两个方框实际上可以被大体上同时地执行或所述方框有时能以相反顺序被执行。此外，在本技术的流程图中所呈现和描述的实施例以示例的方式被提供，目的在于提供对技术更全面的理解。所公开的方法不限于本文所呈现的操作和逻辑流程。可选择的实施例是可预期的，其中各种操作的顺序被改变以及其中被描述为较大操作的一部分的子操作被独立地执行。
[0195]
此外，虽然在功能性模块的背景下描述了本技术，但应当理解的是，除非另有相反说明，功能和/或特征中的一个或多个可以被集成在单个物理装置和/或软件模块中，或者一个或多个功能和/或特征可以在单独的物理装置或软件模块中被实现。还可以理解的是，有关每个模块的实际实现的详细讨论对于理解本技术是不必要的。更确切地说，考虑到在本文中公开的装置中各种功能模块的属性、功能和内部关系的情况下，在工程师的常规技术内将会了解该模块的实际实现。因此，本领域技术人员运用普通技术就能够在无需过度试验的情况下实现在权利要求书中所阐明的本技术。还可以理解的是，所公开的特定概念仅仅是说明性的，并不意在限制本技术的范围，本技术的范围由所附权利要求书及其等同方案的全部范围来决定。
[0196]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储介质中。基于这样的理解，本技术的技术方案本质上或者说
对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储介质中，包括若干程序用以使得一台计算机设备(可以是个人计算机，服务器，或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括：u盘、移动硬盘、只读存储器(rom，read-only memory)、随机存取存储器(ram，random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0197]
在流程图中表示或在此以其他方式描述的逻辑和/或步骤，例如，可以被认为是用于实现逻辑功能的可执行程序的定序列表，可以具体实现在任何计算机可读介质中，以供程序执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从程序执行系统、装置或设备取程序并执行程序的系统)使用，或结合这些程序执行系统、装置或设备而使用。就本说明书而言，“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供程序执行系统、装置或设备或结合这些程序执行系统、装置或设备而使用的装置。
[0198]
计算机可读介质的更具体的示例(非穷尽性列表)包括以下：具有一个或多个布线的电连接部(电子装置)，便携式计算机盘盒(磁装置)，随机存取存储器(ram)，只读存储器(rom)，可擦除可编辑只读存储器(eprom或闪速存储器)，光纤装置，以及便携式光盘只读存储器(cdrom)。另外，计算机可读介质甚至可以是可在其上打印所述程序的纸或其他合适的介质，因为可以例如通过对纸或其他介质进行光学扫描，接着进行编辑、解译或必要时以其他合适方式进行处理来以电子方式获得所述程序，然后将其存储在计算机存储器中。
[0199]
应当理解，本技术的各部分可以用硬件、软件、固件或它们的组合来实现。在上述实施方式中，多个步骤或方法可以用存储在存储器中且由合适的程序执行系统执行的软件或固件来实现。例如，如果用硬件来实现，和在另一实施方式中一样，可用本领域公知的下列技术中的任一项或他们的组合来实现：具有用于对数据信号实现逻辑功能的逻辑门电路的离散逻辑电路，具有合适的组合逻辑门电路的专用集成电路，可编程门阵列(pga)，现场可编程门阵列(fpga)等。
[0200]
在本说明书的上述描述中，参考术语“一个实施方式/实施例”、“另一实施方式/实施例”或“某些实施方式/实施例”等的描述意指结合实施方式或示例描述的具体特征、结构、材料或者特点包含于本技术的至少一个实施方式或示例中。在本说明书中，对上述术语的示意性表述不一定指的是相同的实施方式或示例。而且，描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施方式或示例中以合适的方式结合。
[0201]
尽管已经示出和描述了本技术的实施方式，本领域的普通技术人员可以理解：在不脱离本技术的原理和宗旨的情况下可以对这些实施方式进行多种变化、修改、替换和变型，本技术的范围由权利要求及其等同物限定。
[0202]
以上是对本技术的较佳实施进行了具体说明，但本技术并不限于所述实施例，熟悉本领域的技术人员在不违背本技术精神的前提下还可做作出种种的等同变形或替换，这些等同的变形或替换均包含在本技术权利要求所限定的范围内。

再多了解一些

1/2 1 2 下一页尾页

本文用于企业家、创业者技术爱好者查询，结果仅供参考。

上一篇：返回列表
下一篇：一种瓷砖及岩板产品版面任意连纹的图像处理方法及装置与流程

一种无监督的行人重识别方法、系统、装置及存储介质

相关文献

最热文献