当前位置:   article > 正文

【数据集】目标检测常用数据集||权威数据--持续更新_目标检测数据集

目标检测数据集

        一个性能优良,极度完美的数据集,具有较小偏差的大数据集,对于计算机视觉领域算法的研究是很重要的,具体非常重要的作用!

         在目标检测中,知名的数据集一个接着一个的被发布,被公开,被广大研究者使用,本文是总结目标检测领域的权威数据集,既总结也供有需要的人使用。【后期会将数据集链接加上,方便下载】

下图显示了一些样本及其标注:

其中(a)PASCAL-VOC07,(b)ILSVRC,(c)MS-COCO,and(d)OpenImages。

权威的目标检测数据集主要包括:

        1、【Pascal VOC】ASCALVOCChallenges(VOC2007,VOC2012)

        在早期的计算机视觉社区,PASCALViSualObjectClasses(VOC)挑战赛(从2005年到2012)是最重要的竞赛之一。在PASCALVOC中是多任务的,包括图像分类,目标检测,语义分割和行为检测。

        VOC数据集是目标检测经常用的一个数据集,自2005年起每年举办一次比赛,最开始只有4类,到2007年扩充为20个类,共有两个常用的版本:2007和2012。学术界常用5k的train/val 2007和16k的train/val 2012作为训练集,test 2007作为测试集,用10k的train/val 2007+test 2007和16k的train/val 2012作为训练集,test2012作为测试集,分别汇报结果。

        2、【ILSVRC】

        ImageNetLargeScaleVisualRecognitionChallenge(ILSVRC)已经将一般的目标检测向前推进了一大步。ILSVRC从2010到2017年每年被组织比赛,其中就包含了用ImageNet图像进行检测。ILSVRC中包含了200类视觉目标,图像和目标实例的数量比VOC大两个数量级。例如,ILSVRC-14就包含了517K张图像和534k被标注的目标

        3、【MS-COCO】

        MS-COCO是目前最具有挑战性的目标检测,从2015年开始,每年都会举办基于MS-COCO数据集的竞赛,其包含的目标种类要少于ILSVRC,但其有更多的目标实例。例如,MS-COCO-17中包含了164k张图像和897K个被标注来自80个类别的目标。相比于VOC和ILSVRC,MS-COCO最大的进步,除了boundingbox的标注,还有单个实例分割的标注,帮助更准确的定位。另外,MS-COCO包含了更多小目标(其面积小于图像的1%)和更加密集的定位目标比VOC和ILSVRC。MS-COCO的这些特征让其目标分布更接近于真实的世界。MS-COCO已经在目标检测社区变为了实际的标杆。

        4、【Open Images】

        2018年,OpenImagesDetection(OID)竞赛紧随MS-COCO被引进。在OpenImages中有两个重要的任务:1)标准的目标检测;2)视觉关系检测,即检测具有特定关系的成对目标。对于目标检测任务,此数据集包含了1910k张图像,其中在600多个目标种类上有15440k个标注的boundingbox。

        Open Images是google推出的大型数据集。其中图像detection部分包含600个类别框。

id英文名称中文名称
1Tortoise乌龟
2Container集装箱
3Magpie喜鹊

...

......

        5、【DOTA】
        DOTA是遥感航空图像检测的常用数据集,包含2806张航空图像,尺寸大约为4kx4k,包含15个类别共计188282个实例,其中14个主类,small vehicle 和 large vehicle都是vehicle的子类。其标注方式为四点确定的任意形状和方向的四边形。航空图像区别于传统数据集,有其自己的特点,如:尺度变化性更大;密集的小物体检测;检测目标的不确定性。数据划分为1/6验证集,1/3测试集,1/2训练集。目前发布了训练集和验证集,图像尺寸从800x800到4000x4000不等。
        6、【ImageNet】

        ImageNet是一个计算机视觉系统识别项目, 是目前世界上图像识别最大的数据库。ImageNet是美国斯坦福的计算机科学家,模拟人类的识别系统建立的。能够从图片识别物体。Imagenet数据集文档详细,有专门的团队维护,使用非常方便,在计算机视觉领域研究论文中应用非常广,几乎成为了目前深度学习图像领域算法性能检验的“标准”数据集。Imagenet数据集有1400多万幅图片,涵盖2万多个类别;其中有超过百万的图片有明确的类别标注和图像中物体位置的标注。
原文链接:https://blog.csdn.net/weixin_45074568/article/details/114951516

        除了一般的目标检测,在过去的20年也见证了在特定领域内检测应用的繁荣,例如行人检测,人脸识别,文本检测,交通信号检测和遥感目标检测。

(1)行人检测数据集

(2)人脸检测数据集

(3)文本检测数据集

(4)交通信号灯检测数据集

(5)遥感目标检测数据集

参考总结自:目标检测之公开图像数据集、                      https://blog.csdn.net/weixin_45074568/article/details/114951516

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小丑西瓜9/article/detail/444949
推荐阅读
相关标签
  

闽ICP备14008679号