赞
踩
核密度估计是用于估计随机变
量概率密度函数的一种非参数方法。虽然其数学细节已经超出了本书的范畴,但从总体上讲,核
密度图不失为一种用来观察连续型变量分布的有效方法。绘制密度图的方法(不叠加到另一幅图
上方)为:
plot(density(x))
其中的x是一个数值型向量。由于plot()函数会创建一幅新的图形,所以要向一幅已经存在的图
形上叠加一条密度曲线,可以使用lines()函数
par(mfrow=c(2,1))
d <- density(mtcars$mpg)
plot(d)
d <- density(mtcars$mpg)
plot(d, main="Kernel Density of Miles Per Gallon")
polygon(d, col="red", border="blue")
rug(mtcars$mpg, col="brown")
polygon()函数根据顶点的x和y坐标(本例中由density()函数提供)绘制了多边形。
核密度图可用于比较组间差异。可能是由于普遍缺乏方便好用的软件,这种方法其实完全没
有被充分利用。幸运的是,sm包漂亮地填补了这一缺口。
使用sm包中的sm.density.compare()函数可向图形叠加两组或更多的核密度图。使用格
式为:
sm.density.compare(x, factor)
其中的x是一个数值型向量,factor是一个分组变量。请在第一次使用sm包之前安装它。代码清
单6-8中提供了一个示例,它比较了拥有4个、6个或8个汽缸车型的每加仑汽油行驶英里数
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。