羊村懒王

这个屌丝很懒，什么也没留下！

热门标签

python seaborn 散点图矩阵_Python数据可视化库seaborn的使用总结

作者：羊村懒王 | 2024-02-23 04:51:02

踩

sns.pointplot point size

seaborn是python中的一个非常强大的数据可视化库，它集成了matplotlib，下图为seaborn的官网，如果遇到疑惑的地方可以到官网查看。http://seaborn.pydata.org/

从官网的主页我们就可以看出，seaborn在数据可视化上真的非常强大。

1.首先我们还是需要先引入库，不过这次要用到的python库比较多。

import numpy as np

import pandas as pd

import matplotlib as mpl

import matplotlib.pyplot as plt

import seaborn as sns

2.sns.set_style()：不传入参数用的就是seaborn默认的主题风格，里面的参数共有五种

darkgrid

whitegrid

dark

white

ticks

我比较习惯用whitegrid。

3.下面说一下seaborn里面的调色板，我们可以用sns.color_palette()获取到这些颜色，然后用sns.palplot()将这些色块打印出来。color_palette()函数还可以传入一些参数

sns.palplot(sns.color_palette("hls",n))#显示出n个不同颜色的色块

sns.palplot(sns.color_palette("Paired",2n))#显示出2n个不同颜色的色块，且这些颜色两两之间是相近的

sns.palplot(sns.color_palette("color"))#由浅入深显示出同一颜色的色块

sns.palplot(sns.color_palette("color_r"))##由深入浅显示出同一颜色的色块

sns.palplot(sns.color_palette("cubehelix",n))#显示出n个颜色呈线性变化的色块

sns.palplot(sns.cubehelix_palette(k,start=m,rot=n))#显示出k个start(0,3)为m，rot(-1,1)为n的呈线性变化的色块

sns.palplot(sns.light_palette("color"))#将一种颜色由浅到深显示

sns.palplot(sns.dark_palette("color"))#将一种颜色由深到浅显示

sns.palplot(sns.dark_palette("color",reverse=bool))#reverse的值为False，则将一种颜色由深到浅显示；若为True，则将一种颜色由浅到深显示

4.sns.kdeplot(x,y,cmap=pal)：绘制核密度分布图。

5.sns.distplot(x,kde=bool,bins=n)：kde代表是否进行核密度估计，也就是是否绘制包络线，bins指定绘制的条形数目。

6.根据均值和协方差绘图：

首先我们要根据均值和协方差获取数据

mean,cov = [m,n],[(a,b),(c,d)]#指定均值和协方差

data = np.random.multivariate_normal(mean,cov,e)#根据均值和协方差获取e个随机数据

df = pd.DataFrame(data,columns=["x","y"])#将数据指定为DataFrame格式

然后绘制图像

sns.jointplot(x="x",y="y",data=df) #绘制散点图

用sns.jointplot(x="x",y="y",data=df)可以绘制出x和y单变量的条形图以及x与y多变量的散点图。

7.在jointplot()函数中传入kind=“hex”，能够在数据量比较大时让我们更清晰地看到数据的分布比重。

x,y = np.random.multivariate_normal(mean,cov,2000).T

with sns.axes_style("white"):

sns.jointplot(x=x,y=y,kind="hex",color="c")

绘制出的图像如下

8.sns.pairplot(df)：绘制出各变量之间的散点图与条形图，且对角线均为条形图。

在这里我们可以先使用df = sns.load_dataset("")将seaborn中原本带有的数据读入或用pandas读取。

9.绘制回归分析图：这里可以用两个函数regplot()和lmplot()，用regplot()更好一些。

如果两个变量不适合做回归分析，我们可以传入x_jitter()或y_jitter()让x轴或y轴的数据轻微抖动一些，得出较为准确的结果。

10.sns.stripplot(x="",y="",data=df,jitter=bool)：绘制一个特征变量中的多个变量与另一变量关系的散点图，jitter控制数据是否抖动。

11.sns.swarmplot(x="",y="",hue="",data=df)：绘制页状散点图，hue指定对数据的分类，由于在大量数据下，上面的散点图会影响到我们对数据的观察，这种图能够更清晰地观察到数据分布。

12.sns.boxplot(x="",y="",hue="",data=df，orient="h")：绘制盒形图，hue同样指定对数据的分类。在统计学中有四分位数的概念，第一个四分位记做Q1，第二个四分位数记做Q2，第三个四分位数记做Q3，Q3-Q1得到的结果Q叫做四分位距，如果一个数n,n的范围是nQ3+1.5Q，则称n为离群点，也就是不符合数据规范的点，利用盒形图可以很清晰地观察到离群点。如果传入orient则画出的盒形图是横向的。

13.sns.violinplot(x="",y="",data=df,hue="",split=bool)：绘制小提琴图，split表示是否将两类数据分开绘制，如果为True，则不分开绘制，默认为False。

14.还可以将页状散点图和小提琴图在一起绘制，只需将两个绘图命令

inner="None"表示去除小提琴图内部的形状。

15.sns.barplot(x="",y="",hue="",data=df)：按hue的数据分类绘制条形图。

16.sns.pointplot(x="",y="",hue="",data=df)：绘制点图，点图可以更好的描述数据的变化差异。

17.我们还可以传入其他参数：

sns.pointplot(x="class",y="survived",hue="sex",data=titanic,

palette={"male":"#02ff96","female":"#0980e6"},#指定曲线的颜色

markers=["s","d"],linestyles=["-","-."])#指定曲线的点型和线型

绘制出的图像如下

18.sns.factorplot(x="", y="", hue="", data=df)：绘制多层面板分类图。

sns.factorplot(x="day",y="total_bill",hue="smoker",data=tips)

绘制的图像如下

19.sns.factorplot(x="",y="",hue="",data=df,kind="")：kind中指定要画图的类型。

sns.factorplot(x="day",y="total_bill",hue="smoker",data=tips,kind="bar")

sns.factorplot(x="day",y="total_bill",hue="smoker",col="time",data=tips,kind="swarm")

sns.factorplot(x="time",y="total_bill",hue="smoker",col="day",data=tips,kind="box",size=5,aspect=0.8) #aspect指定横纵比

20.sns.factorplot()的参数：

x,y,hue 数据集变量变量名。

date 数据集数据集名。

row,col 更多分类变量进行平铺显示变量名。

col_wrap 每行的最高平铺数整数。

estimator 在每个分类中进行矢量到标量的映射矢量。

ci 置信区间浮点数或None。

n_boot 计算置信区间时使用的引导迭代次数整数。

units 采样单元的标识符，用于执行多级引导和重复测量设计数据变量或向量数据。

order, hue_order 对应排序列表字符串列表。

row_order, col_order 对应排序列表字符串列表。

kind : 可选：point 默认, bar 柱形图, count 频次, box 箱体, violin 提琴, strip 散点，swarm 分散点 size 每个面的高度（英寸）标量 aspect 纵横比标量 orient 方向 "v"/"h" color 颜色 matplotlib颜色 palette 调色板 seaborn颜色色板或字典 legend hue的信息面板 True/False legend_out 是否扩展图形，并将信息框绘制在中心右边 True/False share{x,y} 共享轴线 True/False。

21.sns.FacetGrid()：这是一个很重要的绘图函数。

g = sns.FacetGrid(tips,col="time")

g.map(plt.hist,"tip")