当前位置:   article > 正文

scatter_matrix矩阵散点图横纵坐标的直观含义和理解_散点矩阵图怎么分析

散点矩阵图怎么分析

以boston房价数据集为例子,每个样本有13个特征,画出矩阵散点图:

pd.plotting.scatter_matrix(features, alpha = 0.3, figsize = (14,8), diagonal = 'kde');

对角线部分表示第i个特征的分布,x轴为该特征的值,y轴为该特征的值出现的次数,也就是说这个图表示第i个特征的密度估计。
 

第i行j列的非对角线部分,表示第i个特征与第j个特征的散点图,用于描述这两个特征的相关性。x轴为第j个特征,y轴为第i个特征。

正相关:自变量x变大时,因变量y随之变大;

负相关:自变量x变大时,因变量y随之变小;

不相关:因变量y不随自变量x的变化而变化。

 

可以认为散点图越接近y=x直线时越正相关,越接近y=-x直线时越负相关。

在这里插入图片描述

如果还是拿不准某对特征是否相关的话,可以用pandas的corr函数量化两个特征之间的相关性。

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/小小林熬夜学编程/article/detail/199162
推荐阅读
相关标签
  

闽ICP备14008679号