赞
踩
对于大量数据的可视化,在一维数据中,直方图(histogram)是一种普遍的方式,另外还有一种方式:核密度估计(kernel density estimation)。除了在可视化方面的用处以外,核密度估计有利与进行聚类算法的构造。
核密度估计方法从直观上来看是平滑化的直方图,从理论角度上来讲是不利用数据分布的先验知识研究数据的分布特征。 优于直方图的一点是核密度估计是可以用于多维空间的。
一组数据的直方图如下
用KDE方法拟和出来的结果
核密度估计方法是类似于激活函数的一种方法,这里激活函数变成了核函数(kernel)。对于取值于R的独立同分布随机变量
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。