赞
踩
本文正在参与新星计划Python学习方向,详情请看:(93条消息) lifein的博客_CSDN博客-SQL SERVER,计算机三级——数据库领域博主
目录
在统计学中,用于度量两个具有二元变量或连续变量的数据对象之间的相关性是对象属性之间线性联系的度量(更一般属性之间的相关性计算可以类似地定义。)更准确地,两个数据变量X和Y之间的相关性(线性相关),由皮尔逊相关性系数(Pearson's correlation)定义,其值介于-1与1之间。
如果没有下载相关绘图的包,需要先
- pip install matplotlib
- pip install seaborn
- pip install numpy
- pip install pandas
调用所需要的包
- import pandas as pd
- import numpy as np
- import matplotlib.pyplot as plt
- import seaborn as sns
1)初始化配置
- df_coor=df.corr()
- plt.subplots(figsize=(9,9),dpi=1080,facecolor='w')# 设置画布大小,分辨率,和底色
- fig = sns.heatmap(data, #对应于上面,此处应为df_coor
- cbar=True,
- annot=True,
- square=True,
- fmt=".3f",
- vmin=0, #刻度阈值
- vmax=1,
- linewidths=.5,
- cmap="RdPu", #刻度颜色
- annot_kws={"size": 10},
- xticklabels=True,
- yticklabels=True) #seaborn.heatmap相关属性
- plt.savefig('filename',dpi=100)
主要参数解释:
· annot为热力图上显示数据
· fmt='.3f':为数据保留三位小数
· square:呈现正方形
· vmax:最大值为1
· 最后保留的形式可以为 “.png” 的形式
- #pearson相关系数
- import pandas as pd
- import numpy as np
- import matplotlib.pyplot as plt
- import seaborn as sns
-
- plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']#让中文的地方显示出来
- df = pd.read_excel(r'D:\演员数据.xlsx',sheet_name='Sheet2')
- df
计算相关性系数:
- df_coor=df.corr()
- df_coor.head()
绘制图表,并保存图片
- plt.subplots(figsize=(9,9),dpi=1080,facecolor='w')# 设置画布大小,分辨率,和底色
- plt.rcParams["font.sans-serif"]=['SimHei']#字体
- plt.rcParams['axes.unicode_minus'] = False
- fig=sns.heatmap(df_coor,annot=True, vmax=1, square=True, cmap="Blues", fmt='.2g')
- fig
- plt.savefig('D:/累计票房和出演累计票房Pearson相关系数图.png',dpi=100)
1、在图表中如果无法显示负号的情况,但是有时候确实会遇到这种情况,这就需要我们添加以下这句代码:
plt.rcParams['axes.unicode_minus'] = False
2、在图表中无法显示文字,则需要添加:
plt.rcParams['font.sans-serif'] = ['Arial Unicode MS']#让中文的地方显示出来
有任何问题,欢迎在下方评论留言。
更多可视化内容,详见个人主页:
(97条消息) lifein的博客_CSDN博客-SQL SERVER,计算机三级——数据库领域博主https://blog.csdn.net/m0_60066036?type=blog
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。