132****7268

2020-09-02   阅读量: 675

机器学习

K-means

扫码加入数据分析学习群

**K-means 的基本思想:**

通过迭代寻找 k 个聚类的一种划分方案,使得用这 k 个聚类的均值来代表相应各类样本时所得的总体误差最小。K-means 算法的基础是最小误差平方和准则。

**K-means 聚类步骤:**

Step1: 随机选择 k 个质心(即 k 个类);

Step2: 计算每一个点到这些质心的距离,然后决定每个点所属的类;

Step3: 对于每个类,重新确定该类的质心

Step4: 若收敛,则结束;否则转到 Step2。

**K-Means缺点:**

- 对聚类中心的初始化比较敏感,不同的初始化带来不同的聚类结果。

- K 值需要首先人工确定(启发式)。

- 只能处理服从标准正态分布的聚类。

- K-means 对于噪声比较敏感。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
32.2574 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子