当前位置:   article > 正文

Python皮尔逊相关系数热力图绘制,下三角,上三角_python画pearson相关系数矩阵图

python画pearson相关系数矩阵图
  1. import pandas as pd
  2. import numpy as np
  3. import seaborn as sns
  4. import matplotlib.pyplot as plt
  5. plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
  6. plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
  7. plt.figure(figsize=(15,5),dpi=300)
  8. # 生成示例数据
  9. np.random.seed(0)
  10. data = np.random.rand(10, 10) # 替换为您的数据
  11. # 创建数据框
  12. df = pd.DataFrame(data)
  13. # 计算皮尔逊相关系数
  14. correlation_matrix = df.corr()
  15. # 绘制热力图
  16. plt.figure(figsize=(10, 8)) # 设置图形大小
  17. sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f", linewidths=0.5)
  18. plt.title('皮尔逊相关系数热力图')
  19. x_new=np.arange(0.5,10.5)
  20. x_label_ticks=["数学","英语","物理","语文","化学","生物","地理","科学","政治","历史"]
  21. plt.xticks(x_new,x_label_ticks,rotation=0)
  22. plt.yticks(x_new,x_label_ticks,rotation=0)
  23. plt.show()

x_label_ticks为所需要绘制的所有特征名,x_new需要改成[0.5,所有特征个数+0.5]

上述代码为完整的皮尔逊相关系数热力图:

下三角热力图
 

  1. import pandas as pd
  2. import numpy as np
  3. import seaborn as sns
  4. import matplotlib.pyplot as plt
  5. plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
  6. plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
  7. plt.figure(figsize=(15,5),dpi=300)
  8. # 生成示例数据
  9. np.random.seed(0)
  10. data = np.random.rand(10, 10) # 替换为您的数据
  11. # 创建数据框
  12. df = pd.DataFrame(data)
  13. # 计算皮尔逊相关系数
  14. correlation_matrix = df.corr()
  15. # 创建下三角矩阵
  16. mask = np.triu(np.ones_like(correlation_matrix, dtype=bool))
  17. np.fill_diagonal(mask, False)
  18. #mask = np.tri(len(correlation_matrix), k=-1)
  19. # 绘制热力图
  20. plt.figure(figsize=(10, 8)) # 设置图形大小
  21. sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f", linewidths=0.5, mask=mask)
  22. plt.title('下三角皮尔逊相关系数热力图')
  23. # 设置刻度标签
  24. x_new = np.arange(0.5, 10.5)
  25. x_label_ticks = ["数学", "英语", "物理", "语文", "化学", "生物", "地理", "科学", "政治", "历史"]
  26. plt.xticks(x_new, x_label_ticks, rotation=0)
  27. plt.yticks(x_new, x_label_ticks, rotation=0)
  28. plt.show()

若无需对角线自相关,则添加np.fill_diagonal(mask, True)即可:

  1. import pandas as pd
  2. import numpy as np
  3. import seaborn as sns
  4. import matplotlib.pyplot as plt
  5. plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
  6. plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
  7. plt.figure(figsize=(15,5),dpi=300)
  8. # 生成示例数据
  9. np.random.seed(0)
  10. data = np.random.rand(10, 10) # 替换为您的数据
  11. # 创建数据框
  12. df = pd.DataFrame(data)
  13. # 计算皮尔逊相关系数
  14. correlation_matrix = df.corr()
  15. # 创建下三角矩阵
  16. mask = np.triu(np.ones_like(correlation_matrix, dtype=bool))
  17. np.fill_diagonal(mask, True)
  18. #mask = np.tri(len(correlation_matrix), k=-1)
  19. # 绘制热力图
  20. plt.figure(figsize=(10, 8)) # 设置图形大小
  21. sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f", linewidths=0.5, mask=mask)
  22. plt.title('下三角皮尔逊相关系数热力图')
  23. # 设置刻度标签
  24. x_new = np.arange(0.5, 10.5)
  25. x_label_ticks = ["数学", "英语", "物理", "语文", "化学", "生物", "地理", "科学", "政治", "历史"]
  26. plt.xticks(x_new, x_label_ticks, rotation=0)
  27. plt.yticks(x_new, x_label_ticks, rotation=0)
  28. plt.show()

上三角热力图:

  1. import pandas as pd
  2. import numpy as np
  3. import seaborn as sns
  4. import matplotlib.pyplot as plt
  5. plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
  6. plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
  7. plt.figure(figsize=(15,5),dpi=300)
  8. # 生成示例数据
  9. np.random.seed(0)
  10. data = np.random.rand(10, 10) # 替换为您的数据
  11. # 创建数据框
  12. df = pd.DataFrame(data)
  13. # 计算皮尔逊相关系数
  14. correlation_matrix = df.corr()
  15. # 创建掩码矩阵
  16. mask = np.tri(len(correlation_matrix), k=0, dtype=bool)
  17. # 绘制热力图
  18. plt.figure(figsize=(10, 8)) # 设置图形大小
  19. sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f", linewidths=0.5, mask=mask)
  20. plt.title('上三角皮尔逊相关系数热力图')
  21. # 设置刻度标签
  22. x_new = np.arange(0.5, 10.5)
  23. x_label_ticks = ["数学", "英语", "物理", "语文", "化学", "生物", "地理", "科学", "政治", "历史"]
  24. plt.xticks(x_new, x_label_ticks, rotation=0)
  25. plt.yticks(x_new, x_label_ticks, rotation=0)
  26. plt.show()

若需要对角列,则numpy的tri函数参数k改成-1即可

  1. import pandas as pd
  2. import numpy as np
  3. import seaborn as sns
  4. import matplotlib.pyplot as plt
  5. plt.rcParams['font.sans-serif'] = ['SimHei'] # 用来正常显示中文标签
  6. plt.rcParams['axes.unicode_minus'] = False # 用来正常显示负号
  7. plt.figure(figsize=(15,5),dpi=300)
  8. # 生成示例数据
  9. np.random.seed(0)
  10. data = np.random.rand(10, 10) # 替换为您的数据
  11. # 创建数据框
  12. df = pd.DataFrame(data)
  13. # 计算皮尔逊相关系数
  14. correlation_matrix = df.corr()
  15. # 创建下三角矩阵
  16. mask = np.tri(len(correlation_matrix), k=-1)
  17. # 绘制热力图
  18. plt.figure(figsize=(10, 8)) # 设置图形大小
  19. sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt=".2f", linewidths=0.5, mask=mask)
  20. plt.title('上三角皮尔逊相关系数热力图')
  21. # 设置刻度标签
  22. x_new = np.arange(0.5, 10.5)
  23. x_label_ticks = ["数学", "英语", "物理", "语文", "化学", "生物", "地理", "科学", "政治", "历史"]
  24. plt.xticks(x_new, x_label_ticks, rotation=0)
  25. plt.yticks(x_new, x_label_ticks, rotation=0)
  26. plt.show()

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/weixin_40725706/article/detail/675283
推荐阅读
相关标签
  

闽ICP备14008679号