当前位置:   article > 正文

R绘图笔记 | 二维散点图与统计直方图组合

r语言把直方图和散点图合在一起

参考前文:R绘图笔记 | R语言绘图系统与常见绘图函数及参数


前面介绍了散点图柱状图直方图和核密度估计图,有时候散点图不能很直观的看的出数据的分布情况,这里介绍散点图与统计直方图组合绘制。


一.方法1

利用ggpubr包的ggscatterhist()函数进行绘制。

  1. ggscatterhist(data, x, y, group = NULL, color = "black", fill = NA,
  2. palette = NULL, shape = 19, size = 2, linetype = "solid",
  3. bins = 30, margin.plot = c("density", "histogram", "boxplot"),
  4. margin.params = list(), margin.ggtheme = theme_void(),
  5. margin.space = FALSE, main.plot.size = 2, margin.plot.size = 1,
  6. title = NULL, xlab = NULL, ylab = NULL, legend = "top",
  7. ggtheme = theme_pubr(), ...)

部分参数解释:

data是用于绘图的数据,x和y分别指定数据中的x轴和y轴,group指定一个分组变量,shape指定点的形状【参考:散点图】。

  1. library(ggpubr)
  2. N<-300
  3. x1 <- rnorm(mean=1.5, N)
  4. y1 <- rnorm(mean=1.6, N)
  5. x2 <- rnorm(mean=2.5, N)
  6. y2 <- rnorm(mean=2.2, N)
  7. data1 <- data.frame(x=c(x1,x2),y=c(y1,y2))
  8. head(data1)
  1. > head(data1)
  2. x y
  3. 1 1.9237124 0.1088482
  4. 2 3.1930833 1.8434623
  5. 3 3.4372797 1.9396251
  6. 4 -0.1662552 1.9320601
  7. 5 1.4886753 0.7804415
  8. 6 1.7652103 0.4776553

margin.plot =  "histogram"指定边缘的图是直方图,margin.params用来指定该图形的参数。看下面代码,比较一下就知道各参数什么意思。

  1. ggscatterhist(
  2. data1, x ='x', y = 'y', shape=21,fill="#7FFFD4",color = "black",size = 3, alpha = 1,
  3. #palette = c("#00AFBB", "#E7B800", "#FC4E07"),
  4. margin.params = list( fill="red",color = "blue", size = 0.3,alpha=1),
  5. margin.plot = "histogram",
  6. legend = c(0.8,0.8),
  7. ggtheme = theme_minimal())

如果是散点图结合核密度估计图,将margin.plot 设置为  "density",多组数据,fill= "class",参数palette指定填充颜色,看一个案例。

  1. N<-200
  2. x1 <- rnorm(mean=1.5, sd=0.5,N)
  3. y1 <- rnorm(mean=2,sd=0.2, N)
  4. x2 <- rnorm(mean=2.5,sd=0.5, N)
  5. y2 <- rnorm(mean=2.5,sd=0.5, N)
  6. x3 <- rnorm(mean=1, sd=0.3,N)
  7. y3 <- rnorm(mean=1.5,sd=0.2, N)
  8. data2 <- data.frame(x=c(x1,x2,x3),y=c(y1,y2,y3),class=rep(c("A","B","C"),each=200))
  1. > head(data2)
  2. x y class
  3. 1 1.9221129 2.139207 A
  4. 2 2.1656947 1.778408 A
  5. 3 1.6277478 2.221711 A
  6. 4 1.1816189 2.006987 A
  7. 5 1.6467425 1.833635 A
  8. 6 0.4997666 2.033704 A
  1. ggscatterhist(
  2. data2, x ='x', y = 'y', #iris
  3. shape=21,color ="black",fill= "class", size =3, alpha = 0.8,
  4. palette = c("#00AFBB", "#E7B800", "#FC4E07"),
  5. margin.plot = "density",
  6. margin.params = list(fill = "class", color = "black", size = 0.2),
  7. legend = c(0.9,0.15),
  8. ggtheme = theme_minimal())

二.方法2

利用ggExtra包的ggMarginal()函数

  1. ggMarginal(p, data, x, y, type = c("density", "histogram", "boxplot",
  2. "violin", "densigram"), margins = c("both", "x", "y"), size = 5, ...,
  3. xparams = list(), yparams = list(), groupColour = FALSE,
  4. groupFill = FALSE)

p:添加边缘地块的ggplot2散点图。如果p不提供,则必须提供所有数据,x和y。

data:用于创建边缘地块的数据。框架。如果p被提供并且边缘图反映相同的数据是可选的。

type:要显示什么类型的边缘图。其中之一是[密度,直方图,箱线图,小提琴,密度图(density, histogram, boxplot, violin, densigram)](“密度图”是指密度图覆盖在直方图上)。

  1. scatter <- ggplot(data=data1,aes(x=x,y=y)) +
  2. geom_point(shape=21,fill="#00AFBB",color="black",size=3)+
  3. theme_minimal()+
  4. theme(
  5. #text=element_text(size=15,face="plain",color="black"),
  6. axis.title=element_text(size=15,face="plain",color="black"),
  7. axis.text = element_text(size=13,face="plain",color="black"),
  8. legend.text= element_text(size=13,face="plain",color="black"),
  9. legend.title=element_text(size=12,face="plain",color="black"),
  10. legend.background=element_blank()
  11. #legend.position = c(0.12,0.88)
  12. )
  13. ggMarginal(scatter,type="histogram",color="black",fill="#00AFBB")

  1. scatter <- ggplot(data=data2,aes(x=x,y=y,colour=class,fill=class)) +
  2. geom_point(aes(fill=class),shape=21,size=3)+#,colour="black")+
  3. scale_fill_manual(values= c("#00AFBB", "#E7B800", "#FC4E07"))+
  4. scale_colour_manual(values=c("#00AFBB", "#E7B800", "#FC4E07"))+
  5. theme_minimal()+
  6. theme(
  7. #text=element_text(size=15,face="plain",color="black"),
  8. axis.title=element_text(size=15,face="plain",color="black"),
  9. axis.text = element_text(size=13,face="plain",color="black"),
  10. legend.text= element_text(size=13,face="plain",color="black"),
  11. legend.title=element_text(size=12,face="plain",color="black"),
  12. legend.background=element_blank(),
  13. legend.position = c(0.9,0.15)
  14. )
  15. ggMarginal(scatter,type="density",color="black",groupColour = FALSE,groupFill = TRUE)

三.方法3

利用grid.arrange()函数。

  1. library(gridExtra)
  2. #(a) 二维散点与统计直方图
  3. # 绘制主图散点图,并将图例去除,这里point层和path层使用了不同的数据集
  4. scatter <- ggplot() +
  5. geom_point(data=data1,aes(x=x,y=y),shape=21,color="black",size=3)+
  6. theme_minimal()
  7. # 绘制上边的直方图,并将各种标注去除
  8. hist_top <- ggplot()+
  9. geom_histogram(aes(data1$x),colour='black',fill='#00AFBB',binwidth = 0.3)+
  10. theme_minimal()+
  11. theme(panel.background=element_blank(),
  12. axis.title.x=element_blank(),
  13. axis.title.y=element_blank(),
  14. axis.text.x=element_blank(),
  15. axis.text.y=element_blank(),
  16. axis.ticks=element_blank())
  17. # 同样绘制右边的直方图
  18. hist_right <- ggplot()+
  19. geom_histogram(aes(data1$y),colour='black',fill='#00AFBB',binwidth = 0.3)+
  20. theme_minimal()+
  21. theme(panel.background=element_blank(),
  22. axis.title.x=element_blank(),
  23. axis.title.y=element_blank(),
  24. #axis.text.x=element_blank(),
  25. axis.text.y=element_blank(),
  26. axis.ticks=element_blank())+
  27. coord_flip()
  28. empty <- ggplot() +
  29. theme(panel.background=element_blank(),
  30. axis.title.x=element_blank(),
  31. axis.title.y=element_blank(),
  32. axis.text.x=element_blank(),
  33. axis.text.y=element_blank(),
  34. axis.ticks=element_blank())
  35. # 要由四个图形组合而成,可以用空白图作为右上角的图形也可以,但为了好玩加上了R的logo,这是一种在ggplot中增加jpeg位图的方法
  36. # logo <- read.jpeg("d:\\Rlogo.jpg")
  37. # empty <- ggplot(data.frame(x=1:10,y=1:10),aes(x,y))+
  38. # annotation_raster(logo,-Inf, Inf, -Inf, Inf)+
  39. # opts(axis.title.x=theme_blank(),
  40. # axis.title.y=theme_blank(),
  41. # axis.text.x=theme_blank(),
  42. # axis.text.y=theme_blank(),
  43. # axis.ticks=theme_blank())
  44. # 最终的组合
  45. grid.arrange(hist_top, empty, scatter, hist_right, ncol=2, nrow=2, widths=c(4,1), heights=c(1,4))

  1. # 绘制主图散点图,并将图例去除,这里point层和path层使用了不同的数据集
  2. scatter <- ggplot() +
  3. geom_point(data=data2,aes(x=x,y=y,fill=class),shape=21,color="black",size=3)+
  4. scale_fill_manual(values= c("#00AFBB", "#E7B800", "#FC4E07"))+
  5. theme_minimal()+
  6. theme(legend.position=c(0.9,0.2))
  7. # 绘制上边的直方图,并将各种标注去除
  8. hist_top <- ggplot()+
  9. geom_density(data=data2,aes(x,fill=class),colour='black',alpha=0.7)+
  10. scale_fill_manual(values= c("#00AFBB", "#E7B800", "#FC4E07"))+
  11. theme_void()+
  12. theme(legend.position="none")
  13. # 同样绘制右边的直方图
  14. hist_right <- ggplot()+
  15. geom_density(data=data2,aes(y,fill=class),colour='black',alpha=0.7)+
  16. scale_fill_manual(values= c("#00AFBB", "#E7B800", "#FC4E07"))+
  17. theme_void()+
  18. coord_flip()+
  19. theme(legend.position="none")
  20. empty <- ggplot() +
  21. theme(panel.background=element_blank(),
  22. axis.title.x=element_blank(),
  23. axis.title.y=element_blank(),
  24. axis.text.x=element_blank(),
  25. axis.text.y=element_blank(),
  26. axis.ticks=element_blank())
  27. # 要由四个图形组合而成,可以用空白图作为右上角的图形也可以,但为了好玩加上了R的logo,这是一种在ggplot中增加jpeg位图的方法
  28. # logo <- read.jpeg("d:\\Rlogo.jpg")
  29. # empty <- ggplot(data.frame(x=1:10,y=1:10),aes(x,y))+
  30. # annotation_raster(logo,-Inf, Inf, -Inf, Inf)+
  31. # opts(axis.title.x=theme_blank(),
  32. # axis.title.y=theme_blank(),
  33. # axis.text.x=theme_blank(),
  34. # axis.text.y=theme_blank(),
  35. # axis.ticks=theme_blank())
  36. # 最终的组合
  37. grid.arrange(hist_top, empty, scatter, hist_right, ncol=2, nrow=2, widths=c(4,1), heights=c(1,4))

参考资料:

1.R语言数据可视化之美,张杰/著

2.grid.arrange()函数帮助文档

3.ggMarginal()函数帮助文档

4.ggscatterhist()函数帮助文档

声明:本文内容由网友自发贡献,不代表【wpsshop博客】立场,版权归原作者所有,本站不承担相应法律责任。如您发现有侵权的内容,请联系我们。转载请注明出处:https://www.wpsshop.cn/w/IT小白/article/detail/131808
推荐阅读
相关标签
  

闽ICP备14008679号