当前位置:   article > 正文

sklearn数据集操作2_rcv1数据集

rcv1数据集

在这里插入图片描述
可在线下载(Downloadable)的数据集
sklearn.datasets.fetch_

在这里插入图片描述
20类新闻文本数据集
该数据集包含了关于20个话题(topic)的18000条新闻报道,这些数据被分为两个子集:训练集和测试集。
在这里插入图片描述
在这里插入图片描述
20组新闻文本数据集API用法详解
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
野外带标记人脸数据集:fetch_lfw_people()
fetch_lfw_pairs()

这是一个在互联网上收集的带标记的著名人物人脸集合,以Jpeg格式存储,官方网址:https//vis-www.cs.umass.edu/lfw/。每一张图片都包含一个居中对齐的人脸。典型的任务是”人脸验证face verification“:给两张图片,用二元分类器来判断是否是同一个人。

”人脸识别face recognition or identification“:给一张未知的人脸图片,在人脸库里面查找匹配,将这张脸到底是谁给认出来。

不管是人脸识别还是人脸验证,他们都依赖于一个人脸检测算法。所以,LFW中的人脸都是用一个人脸检测算法Viola-Jones在不同的web图像集里面检测并扣取出来的。

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
Olivetti人脸数据集:fetch_olivetti_faces()
在这里插入图片描述
在这里插入图片描述
rcv1多标签数据集:fetch_rcv1()
在这里插入图片描述
还有其他的属性如sample_id,target_names等

Forest covertypes:预测森林表面植被类型的数据集,是个多类分类任务数据集。来自美国的森林数据,UCI数据集。

每个样本包含54个特征,其中含有布尔类型的特征。
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
计算机生成的数据集
sklearn.datasets.make_

在这里插入图片描述
用于分类任务和聚类任务的:这些函数产生样本特征向量矩阵以及对应的类别标签集合
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
用于回归任务的
在这里插入图片描述
用于流行学习的
在这里插入图片描述
用于因子分解的
在这里插入图片描述
在这里插入图片描述

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/447862
推荐阅读
相关标签
  

闽ICP备14008679号