陈革007

2020-06-18   阅读量: 759

Python数据分析 机器学习

机器学习: Kmeans的原理,优缺点

扫码加入数据分析学习群

1)从N个数据对象中挑选出k个质心。

2)计算N个数据对象距离不同质心的距离,并将N个数据对象划分到与之距离最小的质心,形成新的k个聚类。

3)重新计算步骤2中获取新的k个聚类的质心,计算方法为求取聚类中所有数据对象的均值。

4)重复2-3步骤,直到每个聚类的数据成员不再发生变化。

优点:

1) 计算机时间短,速度快

2) 容易解释

3) 对球状聚类效果还不错

缺点:

1) 对于离群点和孤立点敏感

2) k值选择

3) 初始聚类中心的选择:多次选择

4) 只能发现球状簇

14.2039 3 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子