赞
踩
KITTI数据集是由德国卡尔斯鲁厄理工学院和丰田美国技术研究院联合创办,利用组装的设备齐全的采集车辆对实际交通场景进行数据采集获得的公开数据集。该数据集包含丰富多样的传感器数据(有双目相机、64线激光雷达、GPS/IMU组合导航定位系统,基本满足对图像、点云和定位数据的需求)、大量的标定真值(包括检测2D和3D包围框、跟踪轨迹tracklet)和官方提供的一些开发工具等。
数据采集自德国卡尔斯鲁厄,采集范围示意图如下:
采集平台示意图如下:
The platform is VW Passat station wagon houses a PC with two six-core Intel XEON X5650 processors and a shock-absorbed RAID 5 hard disk storage with a capacity of 4 Terabytes. Our computer runs Ubuntu Linux (64 bit) and a real-time database to store the incoming data streams.
注:Fig.3. 中坐标系的定义对后续数据的可视化与分析,以及标定矩阵的理解与使用至关重要。
这里主要介绍raw data的组织形式。Raw data采集于2011年9月26, 28, 29, 30和10月3日,共包含180G数据,分为Road
, City
, Residential
和Person
四个序列,样本图像如下:
由于汽车引擎盖和部分天空区域被截取掉,可以看到上述图像的宽度相对较小。
对于上述每个序列,该数据集都提供了传感器原始数据
、目标的3维bounding box
、和标定文件
。文件的目录结构如下:
其中,image_00
至image03
表示四个摄像头采集的图像序列,以8位png格式存储;oxts
文件夹中存放的为GPS/IMU数据。每帧图像都存放了30个不同的GPS/IMU数据;velodyne_points
文件夹存放的是激光雷达数据。date_drive_tracklects.zip
存放的是Tracklects数据;date_calib.zip
存放的是标定数据,需要注意,每天开始采集之前,采集者均对硬件进行了标定。
对于视场中所有运动的目标,该数据集均提供了以Velodyne坐标为准的3维bounding box标签。标签类别包括Car
、Van
、Truck
、Pedestrain
、Person(sitting)
、Cyclist
、Tram
和Misc(eg:, Trailers, Segways)
。
通过数据集提供的开发工具,可以看到如下所示的数据标签:
KITTI数据集官网提供了众多实用的开发工具,感兴趣读者可直接阅读其提供的readme文件。
KITTI数据集提供了针对多个CV任务的BenchMark,如三维目标检测、目标跟踪、SLAM等,详情见KITTI数据集官网。
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。