当前位置:   article > 正文

机器学习数据集pima-indians-diabetes.data 及R语言读入命令

pima-indians-diabetes.data

这个数据集是机器学习常用练习集,包括768个observation,原链接如下

https://archive.ics.uci.edu/ml/machine-learning-databases/pima-indians-diabetes/

已经失效,原因是permission restriction。

从网上搜索到了数据集的内容,并将其转换为tab分隔的文本文件。

主要参考了CSDN博主 姜萌芽 的博文 

文件已上传至共享资源,链接在此 https://download.csdn.net/download/lf94lf94/11828795

各列数据说明如下:

文件默认是5积分下载, 问下各位如何设成免费下载

也可留言免费发送

或者参考博文,用VIM等自行编辑,乐趣自在其中

R语言可以用如下命令读取并命名header:

  1. diabetes <- read.table(file=“pima-indians-diabetes.data”, sep="\t", header=FALSE)
  2. names(diabetes) <- c("npregant", "glucose", "BP", "triceps",
  3. "insulin", "bmi", "pedigree", "age", "class")
  4. diabetes$class <- factor(diabetes$class, levels=c(0,1),
  5. labels=c("normal", "diabetic"))

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/菜鸟追梦旅行/article/detail/671182
推荐阅读
相关标签
  

闽ICP备14008679号