赞
踩
用于显示数据在X轴连续数据段内的分布状况;直方图的变种,使用平滑曲线来绘制数值水平,从而得出更平滑的分布;较直方图,核密度估计图,不受所使用分组数量的影响,更好地界定分布形状;
在概率论中用来估计未知的密度函数,属于非参数检验方法之一;由Rosenblatt和Emanuel Parzen提出,又名Parzen窗(Parzen windows);
采用平滑的峰值函数“核”来拟合观察到的数据点,从而对真实的概率分布曲线进行模拟;核密度估计是一种用于估计概率密度函数的非参数方法;
plotnine包提供geomdensity()函数,绘制核密度估计图;geomdensity()函数的主要参数是带宽(bw)和核函数(kernel);核函数默认为高斯核函数“gaussian”;
峰峦图也可以应用于多数据系列的核密度估计可视化;X轴对应平均温度的数值范围;Y轴对应不同的月份;每个月份的核密度估计数值映射到颜色;可以很好地展示多数据系列的核密度估计结果;
joypy包提供了joyplot()函数,根据数据可以直接绘制不同颜色的核密度估计峰峦图;带有颜色渐变映射的核密度估计峰峦图,可以使用plotnine包的geomlinerange()函数和geomline()函数结合实现;绘制前需要先使用sklearn包的KernelDensity()函数求取每个月份的核密度估计曲线;再根据核密度估计数据绘制峰峦图;
import pandas as pd
from plotnine import *
df=pd.read_csv('d:\python\out\HistDensityD.csv')
#file.close() # 关闭文件
#多数剧系列核密度估计图
base_density=(ggplot(df
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。