2020-04-27
阅读量:
1367
什么是聚类分析?聚类算法有哪几种?请选择一种详细描述其计算原理和步骤。
1、一般把数据聚类归纳为一种非监督式学习,聚类是把相似的对象通过静态分类的方法分成不同的组别或者更多的子集(subset),位于同一个子集中的对象都有相似的一些属性
2、聚类方法主要有:a. 层次聚类 b. 划分聚类:kmeans c. 密度聚类 d. 网格聚类 e. 模型聚类:高斯混合模型
3、划分聚类Kmeans的原理:
第一步选取K个点作为质心;
第二步计算所有样本点到所有质心的距离;
第三步,按照距离进行排序,从中找出单个样本点距离最近的质心并把该样本点划分到最近质心所代表的簇中;
第四步,计算得出刚聚成的各簇的真正质心;
第五步重新计算所有样本点到各个新质心的距离;
依次重复上述过程直到最后无论怎样迭代,所有的质心和样本点归属的类都不再发生变动,或者达到设定的最大迭代次数或者每次质心变动的量小于设定值,迭代结束,聚类完成。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论