当前位置:   article > 正文

python特征相关性可视化分析 - sns.pairplot

python特征相关性可视化分析 - sns.pairplot

seaborn 是一个基于 matplotlib 的 Python 数据可视化库,提供了更高层次的接口来绘制有吸引力的统计图形。pairplotseaborn 中的一个函数,用于绘制数据集中多个变量之间的成对关系图。


基本用法

pairplot 函数可以快速地对数据集中的所有数值变量进行成对关系的可视化。默认情况下,它会在对角线上绘制每个变量的直方图或核密度估计图,在非对角线上绘制散点图。

import seaborn as sns

# 加载示例数据集
tips = sns.load_dataset('tips')

# 绘制 pairplot
sns.pairplot(tips)
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

参数说明

pairplot 函数有许多参数可以调整,以满足不同的可视化需求。以下是一些常用的参数:

  • data:输入的数据集,通常是一个 DataFrame。
  • hue:用于分组的变量,可以是数据集中的一个列名。这将在所有子图中添加颜色编码。
  • vars:指定要绘制的变量列表。
  • kind:指定非对角线上的图类型,可以是 'scatter'(默认)或 'reg'(带回归线的散点图)。
  • diag_kind:指定对角线上的图类型,可以是 'auto'(默认,根据数据类型选择)、'hist'(直方图)或 'kde'(核密度估计图)。
  • markers:指定散点图的标记类型。
  • palette:指定颜色调色板。
  • height:每个子图的高度。
  • aspect:每个子图的宽高比。

示例代码

以下是一个更详细的示例,展示了如何使用 pairplot 函数并调整一些参数:

import seaborn as sns
import matplotlib.pyplot as plt

# 加载示例数据集
tips = sns.load_dataset('tips')

# 绘制 pairplot,并使用 'sex' 列进行颜色编码
sns.pairplot(tips, hue='sex', palette='husl', markers=['o', 's'], diag_kind='kde')

# 显示图形
plt.show()
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11

输出示例

上述代码将生成一个成对关系图,其中每个子图的对角线上是核密度估计图,非对角线上是散点图,并且根据 sex 列进行颜色编码。

在这里插入图片描述


声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/817246
推荐阅读
相关标签
  

闽ICP备14008679号