赞
踩
可在线下载(Downloadable)的数据集
sklearn.datasets.fetch_
20类新闻文本数据集:
该数据集包含了关于20个话题(topic)的18000条新闻报道,这些数据被分为两个子集:训练集和测试集。
20组新闻文本数据集API用法详解
野外带标记人脸数据集:fetch_lfw_people()
fetch_lfw_pairs()
这是一个在互联网上收集的带标记的著名人物人脸集合,以Jpeg格式存储,官方网址:https//vis-www.cs.umass.edu/lfw/。每一张图片都包含一个居中对齐的人脸。典型的任务是”人脸验证face verification“:给两张图片,用二元分类器来判断是否是同一个人。
”人脸识别face recognition or identification“:给一张未知的人脸图片,在人脸库里面查找匹配,将这张脸到底是谁给认出来。
不管是人脸识别还是人脸验证,他们都依赖于一个人脸检测算法。所以,LFW中的人脸都是用一个人脸检测算法Viola-Jones在不同的web图像集里面检测并扣取出来的。
Olivetti人脸数据集:fetch_olivetti_faces()
rcv1多标签数据集:fetch_rcv1()
还有其他的属性如sample_id,target_names等
Forest covertypes:预测森林表面植被类型的数据集,是个多类分类任务数据集。来自美国的森林数据,UCI数据集。
每个样本包含54个特征,其中含有布尔类型的特征。
计算机生成的数据集
sklearn.datasets.make_
用于分类任务和聚类任务的:这些函数产生样本特征向量矩阵以及对应的类别标签集合
用于回归任务的
用于流行学习的
用于因子分解的
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。