赞
踩
Iris数据集是机器学习中常用的经典数据集之一,它包含了150个样本,每个样本有4个特征:花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)和花瓣宽度(petal width)。这些样本被分为3个不同的品种:山鸢尾(setosa)、变色鸢尾(versicolor)和维吉尼亚鸢尾(virginica)。
在R语言中,我们可以使用多种方式对iris数据集进行可视化。下面我将演示几个常用的图形类型,包括散点图、箱线图和直方图。
首先,我们需要加载iris数据集。R语言中已经内置了iris数据集,我们可以直接调用它。以下是加载iris数据集的代码:
data(iris)
接下来,我们可以使用散点图来可视化iris数据集。散点图可以用来观察两个数值型变量之间的关系。下面的代码将花萼长度(sepal length)作为X轴,花瓣长度(petal length)作为Y轴,不同品种的鸢尾花用不同的颜色表示。
plot(iris$Sepal.Length, iris$Petal.Length, col = iris$Species, pch = 19)
legend("topright", legend = levels(iris$Species), col = 1:3, pch = 19)
在上面的代码中,我们使用plot()
函数创建散点图。iris$Sepal.Length
表示花萼长度,iris$Petal.Length
表示花瓣长度,col = iris$Species
用来指定颜色
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。