已经刷新了四大公开数据集纪录？吃一记新ReID数据集安利！

2022 年 8 月 9 日
AI
目标检测, 行人检测, 行人重识别

什么是ReID

ReID（ Re-identification简写），是利用计算机视觉技术判断图像或视频中是否存在特定行人的技术，它是属于图像检索的一个子任务。ReID的概念最早在2006年的CVPR会议上被提出，简单来说，在监控拍不到人脸的情况下，ReID可以代替人脸识别来在视频中找到目标对象。

ReID的应用场景非常广泛。

智能安防

公共安全已成为全社会关注的一个共同话题，与之相辅相成的视频监控系统也得到了大量的普及。24小时不间断的监控视频，成千上万个摄像头，ReID技术可以说是公安侦破案件的强力辅助。

新零售

越来越多的商业综合体接入了ReID技术，希望通过顾客的行为轨迹了解其兴趣，以便优化用户体验。ReID 可以根据顾客外观的照片实时动态跟踪用户轨迹，把轨迹转化成管理员能够理解的信息，以帮助优化商业体验。

智能寻人

在公共场所小朋友不小心与父母走散了，如果小朋友年龄太小也无法听得懂语音广播，这时可以用到ReID技术。父母提供一张小朋友照片，可以实时在当前场景下所有监控摄像头内寻找这个小朋友的照片，相信对立马找到这个小朋友有非常大的帮助。

四大公开数据集

ReID任务中常见的数据集有以下四个：Market-1501、DukeMTMC-reID、CUHK03、MSMT17。

Market-1501

Market-1501数据集在清华大学校园中采集，它包括由6个摄像头拍摄到的1501个行人、32668个检测到的行人矩形框。每个行人至少由2个摄像头捕获到，并且在一个摄像头中可能具有多张图像。训练集有751人，包含12,936张图像，平均每个人有17.2张训练数据；测试集有750人，包含19,732 张图像，平均每个人有26.3张测试数据。3368 张查询图像的行人检测矩形框是人工绘制的，而gallery中的行人检测矩形框则是使用DPM检测器检测得到的。

DukeMTMC-ReID

DukeMTMC数据集是由杜克大学公开的一个大规模标记的多目标多摄像机行人跟踪数据集。它提供了一个由8个同步摄像机记录的新型大型高清视频数据集，具有7,000多个单摄像机轨迹和超过2,700多个独立人物，DukeMTMC-ReID是DukeMTMC数据集的行人重识别子集，并且提供了人工标注的bounding box。

CUHK03

CUHK03是第一个足以进行深度学习的大规模行人重识别数据集，该数据集的图像采集于香港中文大学（CUHK）校园。数据以“cuhk-03.mat”的MAT文件格式存储，含有1467 个不同的人物，由5对摄像头采集。

MSMT17

CVPR2018中提出了一个新的更接近真实场景的大型数据集MSMT17，即Multi-Scene Multi-Time，涵盖了多场景多时段。数据集采用了安装在校园内的15个摄像头网络，其中包含12个户外摄像头和3个室内摄像头。为了采集原始监控视频，在一个月里选择了具有不同天气条件的4天。每天采集3个小时的视频，涵盖了早上、中午、下午三个时间段。原始视频时长为180小时。

技术难点

目前对于以上特定开源数据集ReID算法已经能实现很高的性能，尤其对多角度的人体目前识别效果较好，但仍存在较多难点：

场景遮挡或截断