詹惠儿

2021-02-05   阅读量: 527

Python

聚类算法中初始质心怎么设置比较合适?

扫码加入数据分析学习群

问:

聚类算法中初始质心怎么设置比较合适?


答:

在K-Means中有一个重要的环节,就是放置初始质心。如果有足够的时间,K-means- 定会收敛,但Inertia可能收敛到局部最小值。是否能够收敛到真正的最小值很大程度上取决于质心的初始化。init就是用来帮助我们决定初始化方式的参数。初始质心放置的位置不同,聚类的结果很可能也会不一样,一个好的质心选择可以让K-Means避免更多的计算,让算法收敛稳定且更快。在之前我们可以使用random_state参数来控制每次生成的初始质心都在相同位置,甚至可以画学习曲线来确定最优的random_ state是哪个整数。

一个random. _state对应一个质心随机初始化的随机数种子。如果不指定随机数种子,则sklearn中的K-Means并不会只选择一个随机模式扔出结果, 而会在每个随机数种子下运行多次,并使用结果最好的一个随机数种子来作为初始质心。我们可以使用参数n. _init来选择,每个随机数种子下运行的次数。这个参数不常用到,默认10次,如果我们希望运行的结果更加精确,那我们可以增加这个参数n_ init的值来增加每个随机数种子下运行的次数。


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
80.0000 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子