赞
踩
一个性能优良,极度完美的数据集,具有较小偏差的大数据集,对于计算机视觉领域算法的研究是很重要的,具体非常重要的作用!
在目标检测中,知名的数据集一个接着一个的被发布,被公开,被广大研究者使用,本文是总结目标检测领域的权威数据集,既总结也供有需要的人使用。【后期会将数据集链接加上,方便下载】
下图显示了一些样本及其标注:
其中(a)PASCAL-VOC07,(b)ILSVRC,(c)MS-COCO,and(d)OpenImages。
权威的目标检测数据集主要包括:
1、【Pascal VOC】ASCALVOCChallenges(VOC2007,VOC2012)
在早期的计算机视觉社区,PASCALViSualObjectClasses(VOC)挑战赛(从2005年到2012)是最重要的竞赛之一。在PASCALVOC中是多任务的,包括图像分类,目标检测,语义分割和行为检测。
VOC数据集是目标检测经常用的一个数据集,自2005年起每年举办一次比赛,最开始只有4类,到2007年扩充为20个类,共有两个常用的版本:2007和2012。学术界常用5k的train/val 2007和16k的train/val 2012作为训练集,test 2007作为测试集,用10k的train/val 2007+test 2007和16k的train/val 2012作为训练集,test2012作为测试集,分别汇报结果。
2、【ILSVRC】
ImageNetLargeScaleVisualRecognitionChallenge(ILSVRC)已经将一般的目标检测向前推进了一大步。ILSVRC从2010到2017年每年被组织比赛,其中就包含了用ImageNet图像进行检测。ILSVRC中包含了200类视觉目标,图像和目标实例的数量比VOC大两个数量级。例如,ILSVRC-14就包含了517K张图像和534k被标注的目标
3、【MS-COCO】
MS-COCO是目前最具有挑战性的目标检测,从2015年开始,每年都会举办基于MS-COCO数据集的竞赛,其包含的目标种类要少于ILSVRC,但其有更多的目标实例。例如,MS-COCO-17中包含了164k张图像和897K个被标注来自80个类别的目标。相比于VOC和ILSVRC,MS-COCO最大的进步,除了boundingbox的标注,还有单个实例分割的标注,帮助更准确的定位。另外,MS-COCO包含了更多小目标(其面积小于图像的1%)和更加密集的定位目标比VOC和ILSVRC。MS-COCO的这些特征让其目标分布更接近于真实的世界。MS-COCO已经在目标检测社区变为了实际的标杆。
4、【Open Images】
2018年,OpenImagesDetection(OID)竞赛紧随MS-COCO被引进。在OpenImages中有两个重要的任务:1)标准的目标检测;2)视觉关系检测,即检测具有特定关系的成对目标。对于目标检测任务,此数据集包含了1910k张图像,其中在600多个目标种类上有15440k个标注的boundingbox。
Open Images是google推出的大型数据集。其中图像detection部分包含600个类别框。
id | 英文名称 | 中文名称 |
1 | Tortoise | 乌龟 |
2 | Container | 集装箱 |
3 | Magpie | 喜鹊 |
... | ... | ... |
5、【DOTA】
DOTA是遥感航空图像检测的常用数据集,包含2806张航空图像,尺寸大约为4kx4k,包含15个类别共计188282个实例,其中14个主类,small vehicle 和 large vehicle都是vehicle的子类。其标注方式为四点确定的任意形状和方向的四边形。航空图像区别于传统数据集,有其自己的特点,如:尺度变化性更大;密集的小物体检测;检测目标的不确定性。数据划分为1/6验证集,1/3测试集,1/2训练集。目前发布了训练集和验证集,图像尺寸从800x800到4000x4000不等。
6、【ImageNet】
ImageNet是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。ImageNet是美国斯坦福的计算机科学家,模拟人类的识别系统建立的。能够从图片识别物体。Imagenet数据集文档详细,有专门的团队维护,使用非常方便,在计算机视觉领域研究论文中应用非常广,几乎成为了目前深度学习图像领域算法性能检验的“标准”数据集。Imagenet数据集有1400多万幅图片,涵盖2万多个类别;其中有超过百万的图片有明确的类别标注和图像中物体位置的标注。
原文链接:https://blog.csdn.net/weixin_45074568/article/details/114951516
除了一般的目标检测,在过去的20年也见证了在特定领域内检测应用的繁荣,例如行人检测,人脸识别,文本检测,交通信号检测和遥感目标检测。
(1)行人检测数据集
(2)人脸检测数据集
(3)文本检测数据集
(4)交通信号灯检测数据集
(5)遥感目标检测数据集
参考总结自:目标检测之公开图像数据集、 https://blog.csdn.net/weixin_45074568/article/details/114951516
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。