热线电话:13121318867

登录
2020-08-13 阅读量: 939
聚类和分类

分类:

使用已知的数据集(训练集),得到相应的模型,通过这个模型可以划分未知数据。

分类涉及到的数据集通常是带有标签的数据集;

分类是有监督学习;

一般分两步实现,训练数据得到模型,通过模型划分未知数据。


常用的分类算法包括:

NBC(Naive Bayesian Classifier,朴素贝叶斯分类)算法,

LR(Logistic Regress,逻辑回归)算法,

ID3(Iterative Dichotomiser 3 迭代二叉树3 代)决策树算法,

C4.5 决策树算法,

C5.0 决策树算法,

SVM(Support Vector Machine,支持向量机)算法,

KNN(K-Nearest Neighbor,K 最近邻近)算法,

ANN(Artificial Neural Network,人工神经网络)算法等。


聚类:

直接使用聚类算法将未知数据分为两类或者多类。

聚类是无监督学习;

聚类算法可以分析数据之间的联系,一般分为一步进行;


常见的聚类算法:

K-means聚类算法,

K-Medoids(k中心点),

Canopy 聚类算法,

FCM(Fuzzy C-Means,模糊C 均值)聚类算法,

DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)聚类算法,

LDA(Latent Dirichlet Allocation,隐含狄利克雷分配)算法,

层次聚类算法,

基于EM(Expectation-Maximization,最大期望)的聚类算法等。

32.2370
7
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子