ggplot是基于R的ggplot2和Python的绘图系统。它的构建是为了用最少的代码快速绘制专业又美观的图表。
ggplot与python中的pandas有着共生关系。如果打算使用ggplot,最好将数据保存在DataFrames中。即若想使用ggplot,先将数据转化为dataframe形式,以下我们先来介绍下pandas读取数据的方式。
一、pandas读取数据的方式
1、pandas读取数据库数据
pandas读取mysql的函数:
df=pd.read_sql(sql, con),参数sql指查询数据的sql语句,参数con指mysql的连接。例如,
使用完后记得关闭。
2、pandas读取CSV,TXT,EXCEL
读取csv文件时要带上文件路径(绝对路径或相对路径),参数sep分割号。读取txt和excel与其类似,df1=pd.read_txt(), df2=pd.read_excel() 。
读取数据后开始画图,以下介绍画图步骤以及函数使用说明。
二、ggplot画图步骤以及函数
(一)画图使用到的函数及方法
1、df = ggplot(data, aes(x, y)) ,给参数data里传入数据,x里传入横坐标数据,y里传入纵坐标数据,即可画出一个空白框图;
2、geom_point(),散点图;
3、geom_line(),折线图;
4、geom_point() + geom_line(),折线散点图;
5、添加线条有多种类型的方法
(1)stat_smooth(color='blue'),添加趋势线;
(2)geom_abline(intercept, slope, color, size),添加斜线,intercept确定截距,slope确定斜率,效果类似于stat_smooth();
(3)geom_hline(yintercept, color, size),添加水平线,yintercept确定水平线的位置,color确定颜色,size确定线条宽度;
(4)geom_vline(xintercept, color, size),添加垂线;
6、geom_area(),面积图:ggplot(aes(x='', ymin='', ymax=''),data) + geom_area();
7、geom_bar(),柱状图;
8、geom_density(),概率密度函数图;