当前位置:   article > 正文

python 热力图_python中必会的9中数据可视化技术--第二弹

df.corr().mask()

前面文章介绍了3种很很常见常用的数据可视化技术在Python必会的9种数据可视化技术--第一弹,今天要介绍的不是那么常见但是你也得会哈,不多说,直接往下看

箱型图

箱线图展示中位数,最小值,最大值以及第一和第四四分位数。还有箱型图可以将潜在的异常值显示出来。看例子

import pandas as pdimport seaborn as snsdf = pd.read_csv('mtcars.csv', index_col=0)#fig = plt.figure(figsize=(12, 8)) 这个是调整图像大小,可以不要sns.boxplot(x="vs", y='wt', data=df)
c5027d3b2d13e3a0340f825e9ba0b8f0.png

得到的箱型图

可以看到第一个箱子的上下都给出了几个离群值,这个时候你就应该去看看原始数据,决定离群值如何处理。

热力图

利用热力图可以看数据表里多个特征的情况(常见的就是相关系数的热力图,既表现了相关还表现了相关大小),这个在大型数据的可视化中还是经常会用到的,我们还是以之前的数据做个例子

import pandas as pdimport seaborn as snsdf = pd.read_csv('mtcars.csv', index_col=0)fig = plt.figure(figsize=(12, 8))ax = sns.heatmap(df[['mpg', 'disp', 'hp', 'drat', 'wt', 'qsec']])#数据都是汽车的一些指标,这个数据库很常见,#说明自行百度,数据库链接在文章下方
5bdf72d2a5a731779942568c8b4d043d.png

这个图就显示了颜色越浅,相应车的性能指标越高

上面是个常规的热力图,我们再来看如何画一个相关系数热力图,很常用哦

import numpy as npimport pandas as pdimport seaborn as sns# Correlation matrixcorr = df.corr()#通过mask设置形状mask = np.zeros_like(corr, dtype=np.bool)mask[np.triu_indices_from(mask)] = True#fig = plt.figure(figsize=(12, 8))sns.heatmap(corr, mask=mask, vmax=.3, center=0,            square=True, linewidths=.5, cbar_kws={"shrink": .5})
d67070982f631249e16164507e97ef19.png

是不是必常规的相关系数矩阵好多了?

小提琴图

小提琴图 (Violin Plot)是用来展示多组数据的分布状态以及概率密度。这种图表结合了箱形图和密度图的特征,主要用来显示数据的分布形状。跟箱形图类似,但是在密度层面展示更好。在数据量非常大不方便一个一个展示的时候小提琴图特别适用。还有意思,哈哈。

我还是以之前的数据给出例子

import pandas as pdimport seaborn as snsdf = pd.read_csv('mtcars.csv', index_col=0)sns.violinplot(x="vs", y='wt', data=df)
d222f51da454d87455f47ad542a13859.png

小提琴图,哈哈好丑啊

这个和箱型图有点点类似,但是它能展示密度,具体图怎么看、区别等请百度,都有很详细的说明,我这不写了。


好了,今天就这么多,欢迎大家关注交流,一起进步,发表这些东西的主要目的就是督促自己,希望大家关注评论指出不足,一起进步。内容我都会写的很细,并且按照文章中的代码自己也可以做出一样的结果,一个目的就是零基础也能懂,因为自己就是什么基础没有从零学Python的。

最后附上数据地址自行下载练习https://vincentarelbundock.github.io/Rdatasets/csv/datasets/mtcars.csv

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/我家自动化/article/detail/104837
推荐阅读
相关标签
  

闽ICP备14008679号