登录
首页精彩阅读R语言将层次聚类中的树分成簇
R语言将层次聚类中的树分成簇
2018-01-19
收藏

R语言将层次聚类中的树分成簇

说明

聚类树图中可以观测到聚类的层次,但是仍然得不到组的信息,不过我们可以定义一个聚类树图会拥有多少个簇,并控制树的高度以便将树分成不同的组。
操作
接上节的数据hc
将数据分成四组
fit = cutree(hc,4)
检查数据的簇标签
fit
 [1] 1 1 2 1 2 1 2 2 1 1 1 2 2 1 1 1 2 1 2 3 4 3 4 3 3 4 4 3 4 4 4 3 3 3 4 4 3 4 4 4 4 4 4 4 3 3 4 4 4 3 4 3 3 4 4 4 3 4 4 3
统计每一个簇中的对象数

table(fit)
fit
 1  2  3  4
11  8 16 25
使用红色矩形框可视化矩形的簇

plot(hc,hang = -0.01,cex =0.7)
rect.hclust(hc,k=4,border = "red")

除了使用红色矩形来框来界定簇,还可以使用它对单独某个簇进行标记:

plot(hc,hang = -0.01,cex =0.7)
rect.hclust(hc,k = 4,which = 2,border = "red")

标记特定簇
还可以调用dendextend包,使用不同的颜色来绘制红色矩形框的各个不同聚簇。
根据分支所在的不同簇,对其涂色

library(dendextend)#delete
dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")

不同簇不同色
在这些簇周围添加红色矩形框

dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")
dend %>% rect.dendrogram(k=4,horiz = TRUE)

最后,在图中添加一条切割线来展示对树的操作结:
dend %>% color_branches(k=4) %>% plot(horiz = TRUE,main = "Horizontal Dendrogram")
dend %>% rect.dendrogram(k=4,horiz = TRUE)
abline(v = heights_per_k.dendrogram(dend)["4"] + .1,lwd = 2,lty = 2,col = "blue")

水平聚类树中绘制分割线

数据分析咨询请扫描二维码

客服在线
立即咨询