赞
踩
这个数据集是机器学习常用练习集,包括768个observation,原链接如下
https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/
已经失效,原因是permission restriction。
从网上搜索到了数据集的内容,并将其转换为tab分隔的文本文件。
主要参考了CSDN博主 姜萌芽 的博文
文件已上传至共享资源,链接在此 https://download.csdn.net/download/lf94lf94/11828795。
各列数据说明如下:
或者参考博文,用VIM等自行编辑,乐趣自在其中
R语言可以用如下命令读取并命名header:
- diabetes <- read.table(file=“pima-indians-diabetes.data”, sep="\t", header=FALSE)
- names(diabetes) <- c("npregant", "glucose", "BP", "triceps",
- "insulin", "bmi", "pedigree", "age", "class")
- diabetes$class <- factor(diabetes$class, levels=c(0,1),
- labels=c("normal", "diabetic"))
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。