赞
踩
话不多说,先看最终效果:
圆形树状图是树状图的一个变型,其实都是层次聚类。
接下来看代码步骤:
首先要先安装两个包:
- install.packages("ggtree")
- install.packages("readxl")
咱就别问问什么昂,直接安装就行,代码复制过去,点一下回车键就好~
安装完咱就开始导入数据,我的数据是这样的:
就是随便找的数据,就30多个,在这里我就不上传了,小伙伴们自己简单做一些就好~
- file_path<-"G:/R代码/聚类测试数据.xlsx"
-
- data <- read_excel(file_path)
- #导入数据
导完数据,开始计算距离矩阵:
- mydata<-hclust(dist(data))
- #dist()计算点的距离形成距离矩阵
- #hclust()函数会根据距离矩阵将数据点逐步合并成不同的聚类
然后开始画图:
- p=ggtree(mydata,layout = "circular")+
- geom_text(aes(label=node))#显示树状图每个分支的标签
- #layout = "circular"设置树状图为圆形,
然后我们观察到,树状图分为四类处的值分别为:38,40,42,43。有了这些值就可以给不同类划分颜色区域
为避免过于凌乱,我们在观察到值之后就注释掉代码。然后开始下一步
- geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
- #offset=0.5,标签偏移量,正值向外偏,负值向内。fontface="bold"标签字体为粗体
- geom_highlight(node = 38,fill="red",alpha=0.5)+
- #指定38号节点部分设置为红色,透明度为0.5
- geom_highlight(node=40,fill="blue")+
- geom_highlight(node=42,fill="orange")+
- geom_highlight(node=43,fill="pink")
然后图就变成这样:
有了这个,我们就剩最后一个步骤,给每个类定一个标签:
- geom_cladelabel(node=38,label="A",
- offset=3,barsize =2,hjust=-1,
- vjust=-0.5,color="red")+
- #barsize =2,标签条宽度。hjust=-1,水平对齐方式。vjust=-0.5,垂直对齐方式
- geom_cladelabel(node=40,label="B",
- offset=3,barsize =2,
- hjust=1.5,vjust=-0.5,color="blue")+
- geom_cladelabel(node=42,label="D",
- offset=3,barsize=2,
- hjust=-3,vjust=0.1,color="orange")+
- geom_cladelabel(node=43,label="C",
- offset=3,barsize=2,
- hjust=2,color="pink")
运行结果如下:
完整代码如下:
- library(readxl)
- library(ggtree)
-
- file_path<-"G:/R代码/聚类测试数据.xlsx"
-
- data <- read_excel(file_path)
-
-
- mydata<-hclust(dist(data))
-
-
- ggtree(mydata,layout = "circular")+
- #geom_text(aes(label=node))+
-
- geom_tiplab2(offset=0.5, size=3,fontface="bold",color="black")+
- geom_highlight(node = 38,fill="red",alpha=0.5)+
- geom_highlight(node=40,fill="blue")+
- geom_highlight(node=42,fill="orange")+
- geom_highlight(node=43,fill="pink")+
- geom_cladelabel(node=38,label="A",
- offset=3,barsize =2,hjust=-1,
- vjust=-0.5,color="red")+
- geom_cladelabel(node=40,label="B",
- offset=3,barsize =2,
- hjust=1.5,vjust=-0.5,color="blue")+
- geom_cladelabel(node=42,label="D",
- offset=3,barsize=2,
- hjust=-3,vjust=0.1,color="orange")+
- geom_cladelabel(node=43,label="C",
- offset=3,barsize=2,
- hjust=2,color="pink")
-
小伙伴们换成自己的数据就可以运行啦~
ok,这篇就到这里啦,欢迎小伙伴们批评指正~
Copyright © 2003-2013 www.wpsshop.cn 版权所有,并保留所有权利。