詹惠儿

2021-02-05   阅读量: 563

Scikit-learn

机器学习聚类的参数n_clusters要分几类才比较好 ?

扫码加入数据分析学习群

问:

机器学习聚类的参数n_clusters要分几类才比较好


答:

n_ clusters是K-Means中的k,表示着我们告诉模型我们要分几类。这是K Means当中唯一个必填的参

数,默认为8类,但通常我们的聚类结果会是一个小于8的结果。 通常,在开始聚类之前,我们并不知道

n_ clusters究竟是多少,因此我们要对它进行探索。

当我们拿到-一个数据集,如果可能的话,我们希望能够通过绘图先观察一下这个数据集的数据分布, 以

此来为我们聚类时输入的n_ clusters做一 个参考。


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
80.0000 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程