数据挖掘中的分类技术-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读数据挖掘中的分类技术

数据挖掘中的分类技术

2018-02-27

数据挖掘中的分类技术

KNN（K最近邻算法）

算法核心：如果一个样本在特征空间中K个最相似的样本中的大多数属于一个类别，则该样本也属于这个类别，并具有这个类别的特征

在确定分类时只依靠最邻近的一个或几个样本的类别来决定待分样本所属类别，在做决策时只与极少数的相邻样本有关

由于KNN方法主要依靠周围有限的临近样本，而不是依靠判别类域的方法来确定样本所属类别。对于类域交叉或重叠较多的待分样本集来说，KNN方法较其他方法更合适

决策树

决策树要解决的问题是用哪些属性充当这棵树的各个节点的问题，决策树按分裂标准不同可以分为基于信息论的方法和基于最小GINI指标方法

神经网络

神经网络的学习是一个过程，并按照一定的规则（学习算法）调整各层的权值矩阵，待网络各层权值都收敛到一定值，学习过程结束

支持向量机（SVM）

尽量把样本中从更高维度看起来在一起的样本合在一起

支持向量机的目的是找到一个最优超平面，使分类间隔最大。最优超平面就是要求分类面不但能将两类正确分开，而且使分类间隔最大

在两类样本中离分类面最近且位于平行于最优超平面上的点就是支持向量，为找到最优超平面，只要找到所有的支持向量即可

对于非线形支持向量机，通常做法为把线形不可分转换成线形可分，通过一个非线形映射将低维输入空间中的数据特征映射到高维。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

支持向量机特征 KNN 决策树神经网络 SVM 特征空间数据挖掘

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇R描述性统计分析

下一篇建立数据感性认识

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

数据挖掘中的分类技术

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

CDA数据分析师认证介绍

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

从“工具操作”到“方法驾驭”：CDA数据分析师视角 ...

CDA 持证人专访：杨迅谈保险行业数据产品与数据中台 ...

【CDA干货】MySQL分表数据读取：核心方案、查询优化 ...

从“凭感觉”到“有章法”：CDA数据分析师视角下的 ...

【CDA干货】面板数据聚类分析：方法原理、实操流程 ...

以指标为锚，以体系为纲：CDA数据分析师视角下的指 ...

CDA “暑期学生报名送教材” 活动已开启！ ...

【CDA干货】金融行业运营风险监测：核心统计分析方 ...

【CDA干货】基于数据分析的财险潜在客户挖掘与精准 ...

从“杂乱数据”到“分析资产”：CDA数据分析师视角 ...

CDA持证人专访：何显臻谈餐饮行业数据分析与生产管 ...

【CDA干货】如何利用统计学方法开展数据分析：流程 ...

从“数据描述”到“业务预判”：CDA数据分析师视角 ...

【CDA干货】箱线图上下限计算原理、标准流程与异常 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载