当前位置:   article > 正文

目标检测(1)—— 基础知识和常用数据集_目标检测数据集

目标检测数据集

一、什么是目标检测

一张图片,经过网络后得到输出,检测出感兴趣目标的一个位置,比如下图的车在什么地方,狗在什么地方;还要输出相应位置的目标是什么类别的。
目标检测:位置+类别

  • 矩形框:位置
  • 矩形框:类别

在这里插入图片描述

eg:人脸检测
把人脸作为目标,就把人脸框起来。

在这里插入图片描述
eg:文字检测
把文字当作目标,就把文字框起来。

在这里插入图片描述

重点在于:要学会判断你要做的东西的目标是什么?

主流的目标检测,都是以矩形框的形式进行输出的。一般精度不高。
更高精度的:叫做语义分割

语义分割:用不同的颜色区分开。矩形框会包含背景,所以精度没有那么高。语义分割的训练要求更高。

在这里插入图片描述

  • 总结:目标检测能满足大多数场景,如果需要更高的精度,选择语义分割。

二、目标检测数据集

1、常见的数据集

VOC数据集

VOC2007、VOC2012
训练集-图片:人工对训练集进行标注,需要标注想要的目标在那个位置,对应的是哪个目标
测试集-图片:测试集也有一些标注。
具体如下:(这里省略验证集)
共四种类型的图片,竞赛给参赛者前三种图片,参赛者用自己的网络模型对训练集的图片和标注进行训练,然后用训练好的模型,在测试集的图片上跑一遍,得到测试集的标注。参赛者把测试集的标注提交给比赛方,比赛方把自己的标注和参赛者的标注进行比较后排名。

在这里插入图片描述

为什么用VOC2007、VOC2012?
05-07一个阶段,08-12一个阶段。选择数据集比较大的。

数据集的下载

第一种下载方式:在VOC官网下载。
http://host.robots.ox.ac.uk/pascal/VOC/
第二种下载方式:PyTorch自带。

在这里插入图片描述

数据集的标注

VOC2007:

在这里插入图片描述

  • Annotations:包含了xml文件,描述了图片的各种信息,特别是目标的位置坐标。
  • ImageSets:主要关注Main文件夹,里面的文件包含了不同类别目标的训练/验证数据集图片名称
  • JPEGImages:原图片。
  • SegmentationClass/Object:用于语义分割,不关注。

Annotations:标注
xml是一种规定的格式。

在这里插入图片描述
打开000032.xml,xml里面包括了图片的信息。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
bndbox是核心,打开网站:图片在线查看工具

https://www.gifgit.com/image/rectangle-tool

验证xml中矩形框:

在这里插入图片描述

ImageSets:重点关注Main

在这里插入图片描述

aeroplane_train:aeroplane代表是飞机这一类,train代表是训练集,剩下的同。

在这里插入图片描述

000032.jpg是飞机,打开aeroplane_train.txt

在这里插入图片描述

该图片在飞机这一类。只要图片中有飞机(不是有一个飞机),就是1,为正样本;-1代表图片中没有飞机。

在这里插入图片描述

JPEGImages:原图。

在这里插入图片描述
例如:000031.jpg

在这里插入图片描述

针对目标检测,2012没有包含2007,从2008开头的;针对图像分割,就包含了2007。

COCO数据集

官网:https://cocodataset.org/#home

在这里插入图片描述
常用COCO2017,下载2017的val和它的标注,看一下是怎么标注的。(所以就下个小的,和18G的目录一样)

在这里插入图片描述
val2017:里面是图片。

在这里插入图片描述
在这里插入图片描述
打开任意的一个instance的json文件,发现很大,这里用一小部分举例子(只有两张图片)。

图片中没有群体的情况:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

图片中有群体的情况:

在这里插入图片描述
在这里插入图片描述
segmentation中的counts表述方式为:

在这里插入图片描述
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/444941
推荐阅读
相关标签
  

闽ICP备14008679号