当前位置:   article > 正文

Python绘制传统相关性矩阵/下三角相关性矩阵/重点相关性矩阵

相关性矩阵

        数据科学最重要的技能之一就是数据可视化,在数据建模过程中,我们比较关心数据之间的相关性,而观察数据相关性我们使用最多的技能之一就是相关性矩阵。数据相关性矩阵可以让我们对数据之间的关联关系有更为直观的理解。这里简单汇总一下使用Python绘制传统相关性矩阵/下三角相关性矩阵/重点相关性矩阵的代码

1. 传统相关性矩阵

图片

  1. import pandas as pd
  2. import seaborn as sns
  3. import matplotlib.pyplot as plt
  4. %matplotlib inline
  5. df = pd.read_csv('./data/melb_data.csv')
  6. # Calculate pairwise-correlation
  7. matrix = df.corr()
  8. cmap = sns.diverging_palette(250, 15, s=75, l=40, n=9, center="light", as_cmap=True)
  9. plt.figure(figsize=(12, 8))
  10. sns.heatmap(matrix, center=0, annot=True,
  11. fmt='.2f', square=True, cmap=cmap)

2. 下三角相关性矩阵

图片

  1. import numpy as np
  2. # mask掉上三角部分
  3. mask = np.triu(np.ones_like(matrix, dtype=bool))
  4. plt.figure(figsize=(12, 8))
  5. sns.heatmap(matrix, mask=mask, center=0, annot=True, fmt='.2f', square=True, cmap=cmap)

3. 重点相关性矩阵(即只画出相关性指数大于阈值的那部分)

图片

  1. # mask掉上三角 & 小于某个阈值的值
  2. mask1 = np.triu(np.ones_like(matrix, dtype=bool))
  3. mask2 = np.abs(matrix) <= 0.1
  4. mask = mask1 | mask2
  5. plt.figure(figsize=(12, 8))
  6. sns.heatmap(matrix, mask=mask, center=0, annot=True,fmt='.2f', square=True, cmap=cmap)

 

 

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/Monodyee/article/detail/104860
推荐阅读
相关标签
  

闽ICP备14008679号