Kmeans算法的优点和缺点

K-MEANS算法是输入聚类个数k，以及包含 n个数据对象的数据库，输出满足方差最小标准k个聚类的一种算法。k-means 算法接受输入量 k ；然后将n个数据对象划分为 k个聚类以便使得所获得的聚类满足：同一聚类中的对象相似度较高；而不同聚类中的对象相似度较小。

K-means算法的优点是：

计算时间段，速度快

能根据较少的已知聚类样本的类别对树进行剪枝确定部分样本的分类

算法本身具有优化迭代功能

由于只是针对部分小样本，可以降低总的聚类时间复杂度

K-means算法的缺点是：

算法中 K 是事先给定的，这个 K 值的选定是非常难以估计的。很多时候，事先并不知道给定的数据集应该分成多少个类别才最合适；

初始值选择的不好，可能无法得到有效的聚类结果

需要不断地进行样本分类调整，不断地计算调整后的新的聚类中心

对异常值敏感