赞
踩
文章将介绍如何使用Python中的Pandas和Seaborn库来读取数据、计算相关系数矩阵,并绘制出直观、易于理解的热力图。我们将逐步介绍代码的编写和执行过程,并提供详细的解释和示例,以便读者能够轻松地跟随和理解。
大家记得需要准备以下条件数据:(大家可以看我上一篇文章)
- import pandas as pd
- import seaborn as sns
- import matplotlib.pyplot as plt
data = pd.read_excel("result1_1.xlsx")
data = data.apply(pd.to_numeric, errors='coerce')
这行代码使用pandas的apply
方法结合to_numeric
函数,将数据框(data frame)data
中的每一列尝试转换为数值类型。errors='coerce'
参数意味着在转换过程中,如果遇到无法转换为数值的元素,将替换为NaN
。
correlation_matrix = data.corr()
这行代码计算数据框data
中所有列之间的相关系数,并将结果存储在correlation_matrix
中。
- plt.figure(figsize=(10, 8))
- sns.heatmap(correlation_matrix, annot=True, cmap='coolwarm', fmt='.2f')
- plt.title('Correlation Heatmap')
- plt.show()
这些代码行设置图表的大小,然后使用seaborn的heatmap
函数绘制一个热力图,其中annot=True
表示在热力图上显示每个单元格的具体数值,cmap='coolwarm'
设置了颜色映射为coolwarm,fmt='.2f'
设置了数值的格式为两位小数。最后,设置图表的标题为’Correlation Heatmap’,并使用plt.show()
显示图表。
整个代码执行后,您将看到一个包含数据列之间相关系数的热力图,这有助于您可视化数据之间的关系!
本篇文章到这里就结束了,大家去试试自己的吧,点赞投币加收藏~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。