阿抽哥哥

2018-10-20   阅读量: 1290

数据分析师 统计学 SPSS

如何理解聚类中的轮廓系数?

扫码加入数据分析学习群

轮廓系数,是聚类效果好坏的一种评价方式,它结合内聚度和分离度两种因素:

内聚度:某样本 i 到同簇内所有点的平均距离 - ai,也称簇内不相似度,当 ai 越小说明样本 i 越应该被聚类到该簇。

分离度:某样本 i 到其他某簇内所有点平均距离 - bi,也称簇间不相似度,当 bi 越大说明样本 i 越不属于其他簇。

s(i) 接近1,则说明样本i聚类合理;

s(i) 接近-1,则说明样本i更应该分类到另外的簇;

s(i) 近似为0,则说明样本i在两个簇的边界上。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
107.4525 2 3 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子