赞
踩
最近一段时间开始了深度学习领域的学习,但总是东看看西看看停留在表面。看过的东西很快就忘了,遇到不懂的地方也都就扔到了一边,鉴于学术和毕业上的压力,决定开始更新这个博客,一方面记录整理自己学过的东西,另一方面也为了督促自己每天都能够有所进步。
这篇文章是在学习罗浩老师发布在bilibili上的课程后进行的,对于那些准备进入行人重识别领域的小白来说,在这里推荐一下罗浩老师的课程。虽说发布时间已经是几年前了,有些框架或者知识已经更新,但仍是不可多得的入门材料。
b站浙江大学罗浩博士行人重识别课程链接
行人重识别(Person re-identification)也称行人再识别, 被广泛认为是一个图像检索的子问题, 是利用计算机视觉技术判断图像或者视频中是否存在特定行人的技术, 即给定一个监控行人图像检索跨设备下的该行人图像。行人重识别技术可以弥补目前固定摄像头的视觉局限, 并可与行人检测、行人跟踪技术相结合, 应用于视频监控、智能安防等领域。
一个完整的行人重识别系统包括以下几个部分:
1.数据
2.行人重识别系统
数据集通常是通过人工标注或者检测算法得到的行人图片,目前与检测独立,注重识别
• 数据集分为训练集 、 验证集 、 Query 、Gallery
• 在训练集上进行模型的训练,得到模型后对Query与Gallery中的图片提取特征计算相似
度,对于每个Query在Gallery中找出前N个与其相似的图片
• 训练、测试中人物身份不重复
现存的数据集可以分为两类:
单帧呢就是指采集的图片为单张的,不连续的图片。在标注时,一张图片就是一个id。
相比较单帧的我们可以看出序列数据集的图片都是连续的动作。而且不同于单帧的图片,是一组图片才是一个id。
在这里顺便给出一个网站,这个网站归纳了常用的行人再识别领域的数据集网站,但最常用的还是上面列举的几个:行人再识别数据集.
1.rank-k
rank-k:算法返回的排序列表中,前k位为存在检索目标则称为rank-k命中
2.CMC曲线
Cumulative Match Characteristic (CMC) curve:计算rank-k的击中率,形成rank-acc的曲线
3.mAP曲线
mAP(mean average precision):反应检索的人在数据库中所有正确的图片排在排序列表前面的程度,能更加全面的衡量ReID算法的性能。
1.single shot vs multi shot
Single shot是指gallery中每个人的图像为一张(N=1),而multi shot是指gallery中每个人的图像为N>1张图像。同样的Rank-k下,一般N越大,得到的识别率越高。
2.single query vs multi query
Single query是指probe中每个人的图像为一张(N=1),而multi query是指probe中每个人的图像为N>1张图像,然后融合N张图片的特征(最大池化或者平均池化)作为最终特征。同样的Rank-k下,一般N越大,得到的识别率越高。
在这里总结概括一下基于深度学习的行人重识别方法,根据训练损失可以分为基于表征学习和度量学习;根据特征是否考虑局部特征可以分为基于全局特征和基于局部特征特征;根据数据不同可以分为基于单帧图像和基于视频序列的方法;除此之外呢,还有一类基于GAN的的方法。(这些方法在后面都会提到)
本身就是对识别出来的图片进行一种聚类分析。
好了,我的这篇博客到这里就结束了,欢迎研究这个方向的朋友一起交流。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。