赞
踩
PASCAL VOC数据集除了用于segmentation任务之外,还用于object detection等任务。因此不是所有image都有pixel-wise的标注,有些图片只有object-wise的标注。
语义类别:
该数据集包含20个对象类,加背景共21类: + person; + bird; cat;cow;dog;horse;sheep; + aerphone;bicycle;boat;bus;car;matorbike;train; + bottle;chair;dining table;potted plant;sofa;monitor,
该数据集包含10个动作类: running,jumping,phoning,playing music instrument,reading,riding,riding a horse,taking a photo,using a computer,walking
文件结构:
数据集文件列表中,语义分割中常用的几个文件如下:
数据集划分:
查看"ImageSets/Segmentation"目录下的txt文件可知train set、val set和test set包含的图像数量如下:
推荐: 数据集自动下载+整理 ,参见github:https://github.com/StoneWST/Dataset-Tool-Segmentation/ ,操作简单仅运行.sh文件即可。
此外,还可以手动下载:
VOC2012的JPEGimages中的图像和VOC2011的JPEGimages中的图像是一模一样的,都是17125张。
VOC2011中提到,并不是所有图像都有pixel-level的标注,VOC 2012就是在VOC2011的基础上,对一些图像增加了标注。
语义类别:
与VOC2011相同,21类(包含背景类)。
文件结构:
数据集中文件的存放格式也与VOC2011相同。
数据集划分:
推荐: 数据集自动下载+整理 ,参见github:https://github.com/StoneWST/Dataset-Tool-Segmentation/ 。
此外,还可以手动下载:
SBD 数据集是一个VOC2011数据集的增强版,包含来自 PASCAL VOC 2011 数据集的 11355 张图像的标注,SBD中的11355张图像,完全选自VOC2011数据集中的JPEGimages文件夹中的图片,只是对其中更多的图像进行了标注。类别种类也与 VOC 2011 相同(21个类别)。
该数据集于 2011 年由加州大学伯克利分校发布,相关论文为 Semantic contours from inverse detectors。作者还提供了一个网站,里边有较详细的介绍。
文件结构:
数据集中各文件说明如下:
注:cls和inst的区别是比如,如果图中有人、狗、背景,那么在inst中人、狗、背景分别对应的数字是0、1、2,而在cls中对应的数字为2、5、0。即inst的标注信息中的数字仅用于区分该张图像中的不同类别物体,至于哪个类别对应的是哪个数字,并不care。
因此,语义分割中用到的标签信息应该是cls。由于.mat文件并不方便,事实上在预处理时,为了和VOC数据集保持一致,可以将.mat格式的label标注文件转换成.png格式(利用调色板),代码: https://github.com/StoneWST/Dataset-Tool-Segmentation/blob/master/py/voc.py 中的 SBD_label_mat2png 函数。
数据集划分:
SBD数据集只有训练集和验证集,具体数量如下:
SBD train set中包含了一部分VOC2011和VOC2012的val set中的图片:
- VOC_2011_subval(736) = VOC_2011_val(1111) - VOC_2011_val和SBD_train重复的图片(375)
- VOC_2012_subval(904) = VOC_2012_val(1449) - VOC_2012_val和SBD_train重复的图片(545)
因此,如果想使用SBD train set作为训练集、VOC2011或VOC2012作为验证集时,需要取VOC2011或VOC2012的子集作为验证集(扣除其中包含在SBD train set中的图像)。
如何生成VOC_2011_subval(736)和VOC_2012_subval(904)的.txt文件,代码: https://github.com/StoneWST/Dataset-Tool-Segmentation/blob/master/py/voc.py 中的 generate_VOC2011_VOC2012_subval_txt 函数。
推荐: 数据集自动下载+整理 ,参见github:https://github.com/StoneWST/Dataset-Tool-Segmentation/ 。
也可以手动下载,链接:http://www.eecs.berkeley.edu/Research/Projects/CS/vision/grouping/semantic_contours/benchmark.tgz
SBD是VOC2011和VOC2012的一个增强版本,但是他们之间的兼容性还存在一些问题:(1) VOC2012 train set中有331张image,不包含在 SBD train set中。这导致了,无论 VOC2012 还是 SBD 的 train set 都不是最强的。(2) VOC2012 val set中有545张image,包含在 SBD train set中。这导致了,使用SBD train set作为训练集、VOC2012作为验证集时,只能使用VOC2012的subval set。
考虑到以上两点不足,PASCAL VOC 2012 Augment(VOC2012AUG)就诞生了。 + 针对问题(2),VOC2012AUG 的 val set 就等于 VOC2012 的 val set + 针对问题(1),VOC2012AUG 的 train set 聚合了 VOC2012 train set(a)、SBD train set(b) 和 SBD val set(c),并扣除了 b与a重复的部分、c与a重复的部分、b与VOC2012 val set重复的部分、c与VOC2012 val set重复的部分。
数据集构成:
PASCAL VOC2012AUG 的构成如下:
- VOC2012AUG_train(10582) = VOC2012_train(1464) + SBD_train(8498) + SBD_val(2857) - SBD_train与VOC2012_train重复部分(1133)
- - SBD_val与VOC2012_train重复部分(1) - SBD_train与VOC2012_val重复部分(545) - SBD_val与VOC2012_val重复部分(558)
-
- VOC2012AUG_val(1449) = VOC2012_val(1449)
因为VOC2012AUG是由VOC2012和SBD组成的,因此不需要额外下载,只需要做一些额外的reorganize。代码:https://github.com/StoneWST/Dataset-Tool-Segmentation/blob/master/voc.sh
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。