啊啊啊啊啊吖

2021-05-28   阅读量: 39

Scikit-learn 数据分析师

K均值聚类算法里类别数k的选择

k均值聚类中的类别数k值需要预先指定,而在实际应用中最优的k值是不知道的。

尝试用不同的k值聚类,检验得到聚类结果的质量,推测最优的k值。

聚类结果的质量可以用类的平均直径来衡量。


一般地,类别数变小时,平均直径会增加

类别数变大超过某个值以后,平均直径会不变,而这个值正是最优的k值。实验时,可以采用二分查找,快速找到最优的k值。


0.0000 0 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子