聚类算法中初始质心怎么设置比较合适?

詹惠儿

2021-02-05 阅读量: 1054

聚类算法中初始质心怎么设置比较合适?

问：

聚类算法中初始质心怎么设置比较合适?

答：

在K-Means中有一个重要的环节，就是放置初始质心。如果有足够的时间，K-means- 定会收敛,但Inertia可能收敛到局部最小值。是否能够收敛到真正的最小值很大程度上取决于质心的初始化。init就是用来帮助我们决定初始化方式的参数。初始质心放置的位置不同，聚类的结果很可能也会不一样，一个好的质心选择可以让K-Means避免更多的计算,让算法收敛稳定且更快。在之前我们可以使用random_state参数来控制每次生成的初始质心都在相同位置，甚至可以画学习曲线来确定最优的random_ state是哪个整数。

一个random. _state对应一个质心随机初始化的随机数种子。如果不指定随机数种子，则sklearn中的K-Means并不会只选择一个随机模式扔出结果，而会在每个随机数种子下运行多次,并使用结果最好的一个随机数种子来作为初始质心。我们可以使用参数n. _init来选择,每个随机数种子下运行的次数。这个参数不常用到，默认10次，如果我们希望运行的结果更加精确，那我们可以增加这个参数n_ init的值来增加每个随机数种子下运行的次数。

80.0000

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子