2020-07-15
阅读量:
1755
python:什么是轮廓系数?
轮廓系数是最常⽤用的聚类算法的评价指标。它是对每个样本来定义的,它能够同时衡量量:
1)样本与其⾃自身所在的簇中的其他样本的相似度a,等于样本与同⼀一簇中所有其他点之间的平均距离
2)样本与其他簇中的样本的相似度b,等于样本与下⼀一个最近的簇中的所有点之间的平均距离
根据聚类的要求 ”簇内差异⼩小,簇外差异⼤大“,我们希望b永远⼤大于a,并且⼤大得越多越好
单个样本的轮廓系数计算为
轮廓系数可以分成三种情况:
1越远越系数越接近于1越好;
2. 接近于0,簇比较接近,优先分成一个簇
3.小于0的情况,考虑分到更接近的簇






评论(0)


暂无数据
推荐帖子
2条评论
0条评论
2条评论