2020-08-13
阅读量:
939
聚类和分类
分类:
使用已知的数据集(训练集),得到相应的模型,通过这个模型可以划分未知数据。
分类涉及到的数据集通常是带有标签的数据集;
分类是有监督学习;
一般分两步实现,训练数据得到模型,通过模型划分未知数据。
常用的分类算法包括:
NBC(Naive Bayesian Classifier,朴素贝叶斯分类)算法,
LR(Logistic Regress,逻辑回归)算法,
ID3(Iterative Dichotomiser 3 迭代二叉树3 代)决策树算法,
C4.5 决策树算法,
C5.0 决策树算法,
SVM(Support Vector Machine,支持向量机)算法,
KNN(K-Nearest Neighbor,K 最近邻近)算法,
ANN(Artificial Neural Network,人工神经网络)算法等。
聚类:
直接使用聚类算法将未知数据分为两类或者多类。
聚类是无监督学习;
聚类算法可以分析数据之间的联系,一般分为一步进行;
常见的聚类算法:
K-means聚类算法,
K-Medoids(k中心点),Canopy 聚类算法,
FCM(Fuzzy C-Means,模糊C 均值)聚类算法,
DBSCAN(Density-Based Spatial Clustering of Applications with Noise,具有噪声的基于密度的聚类方法)聚类算法,
LDA(Latent Dirichlet Allocation,隐含狄利克雷分配)算法,
层次聚类算法,
基于EM(Expectation-Maximization,最大期望)的聚类算法等。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论