赞
踩
人脸识别数据集精粹(上)
人脸检测和关键点检测都是比较底层的任务,而人脸识别是更高层的任务,它就是要识别出检测出来的人脸是谁,完成身份比对等任务,也是人脸领域里被研究最多的任务。
1.1 人脸识别图片数据集
(1) FERET
数据库地址:http://www.nist.gov/itl/iad/ig/colorferet.cfm。
发布于1993年至1996年,由FERET项目创建,包含14051张多姿态,不同光照的灰度人脸图像,每幅图中均只有一个人脸,在早期的人脸识别领域应用非常广泛。
(2) Yale与YALE B
数据集地址:http://vision.ucsd.edu/~iskwak/ExtYaleDatabase/Yale%20Face%20Database.htm。
Yale人脸数据库与YALE人脸数据库B分别发布于1997年和2001年,这是两个早期的灰度数据集。Yale人脸数据库由耶鲁大学计算视觉与控制中心创建,包含15位志愿者的165张图片,包含光照、表情和姿态的变化。
后面将其拓展到YALE人脸数据库B,包含了10个人的5760幅多姿态,多光照的图像。具体包括9个姿态、64种光照变化,在实验室严格控制的条件下进行。虽然每个人的图像很多,但是由于采集人数较少,该数据库的进一步应用受到了比较大的限制。
(3) LFW
数据集地址:http://vis-www.cs.umass.edu/lfw/index.html#download。
Labeled Faces in the Wild(LFW)发布于2007年,是为了研究非限制环境下的人脸识别问题而建立,这是比较早期而重要的测试人脸识别的数据集,所有的图像都必须要能够被经典的人脸检测算法VJ算法检测出来。
该数据集包含5749个人的13233张全世界知名人士的图像,其中有1680人有2张或2张以上人脸图片。它是在自然环境下拍摄的,因此包含不同背景、朝向、面部表情,且每个图像都被归一化到250×250大小。
CALFW数据集是LFW数据集的拓展,地址为http://www.whdeng.cn/calfw/index.html?reload=true,它包含了3000对具有较大年龄跨度的人脸图像,可以用于评估人脸识别算法在跨年龄识别中的性能。
(4) CAS-PEAL
数据集地址:http://www.jdl.ac.cn/peal/。
发布于2008年,CAS-PEAL数据集是中国科学院收集建立的,它主要是为了提供一个大规模的中国人脸数据集用于训练和评估对应东方人的算法,有灰度图和彩色图两个版本。目前,CAS-PEAL人脸数据库由1040个人(595名男性和445名女性)的99594张图像组成,在特定环境下具有不同的姿势、表情、照明条件、表情以及是否佩戴眼镜等信息。对于每个被拍摄的人,通过9个相机来同时捕获不同姿态的图像,平均每一个人采集了约900张图像。
(5) CMU PIE与Multi-PIE
CMU PIE数据集地址:https://www.ri.cmu.edu/publications/the-cmu-pose-illumination-and-expression-pie-database-of-human-faces/
Multi-PIE数据集地址:http://www.cs.cmu.edu/afs/cs/project/PIE/MultiPie/Multi-Pie/Home.html。
CMU PIE数据集发布于2000年,PIE就是姿态(Pose)、光照(Illumination)和表情(Expression)的缩写,包含68位志愿者的41368张图,每个人有13种姿态条件,43种光照条件和4种表情。其中的姿态和光照变化图像也是在严格控制的条件下采集的,它在推动多姿势和多光照的人脸识别研究方面具有非常大的影响力,不过仍然存在模式单一多样性较差的问题。
为了解决这些问题,卡内基梅隆大学的研究人员在2009年建立了Multi-PIE数据集。它包含337个人,在15个角度,19个照明条件和不同的表情下记录,最终超过750000个图像。由于图像质量较高,原始的图片大小超过了300G,需要购买。
(6) Pubfig
数据集地址:http://www.cs.columbia.edu/CAVE/databases/pubfig/。
发布于2010年,这是哥伦比亚大学的公众人物脸部数据集,包含有200个人的58797张人脸图像,主要用于非限制场景下的人脸识别。与LFW相比,这个数据集更大,但是人更少,每个人的图片更多。
(7) MSRA-CFW
数据集地址:http://research.microsoft.com/en-us/projects/msra-cfw/。
发布于2012年,由微软亚洲研究院收集整理,包含1583个人的202792张图像,采用了自动标注的方法。
(8) CASIA-WebFace
数据集地址:http://classif.ai/dataset/casia-webface/。
发布于2014年,这是中国科学院自动化研究所李子青实验室开放的国内非常有名的数据集,包含10575个人494414张图。
(9) FaceScrub
数据集地址:http://vintage.winklerbros.net/facescrub.html。
发布于2016年,总共包含了530个人的106863张图片,其中男性女性各占265,分别包括55306和51557张图,每个人大概200张图。
(10) UMDFaces
数据集地址:http://www.umdfaces.io/。
发布于2016年,这个数据集有静态图和视频两部分,其中静态图包含8277个人的367888张脸,视频包含22075个视频中的3107个人的3735476张图。同时标注了21个关键点,性别信息,以及人的3个姿态。
(11) MegaFace
数据集地址:http://megaface.cs.washington.edu/dataset/download.html。
发布于2016年,M
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。