詹惠儿

2018-12-16   阅读量: 665

数据分析师 Python编程 Python数据分析

SVM简介

扫码加入数据分析学习群


在机器学习中,支持向量机(SVM,也支持向量网络)是具有相关学习算法的监督学习模型,用于分析用于分类和回归分析的数据。
支持向量机(SVM)是由分离超平面正式定义的判别分类器。换句话说,给定标记的训练数据(监督学习),算法输出最佳超平面,其对新示例进行分类。

SVM方法建立在统计学VC维和结构风险最小化原则上,既可以用于分类(二/多分类)、也可用于回归和异常值检测。SVM具有良好的鲁棒性,对未知数据拥有很强的泛化能力,特别是在数据量较少的情况下,相较其他传统机器学习算法具有更优的性能。

什么是支持向量机?

SVM模型是将示例表示为空间中的点,映射使得单独类别的示例除以尽可能宽的明确间隙。
除了执行线性分类之外,SVM还可以有效地执行非线性分类,隐式地将它们的输入映射到高维特征空间。

SVM做什么?

给定一组训练示例,每个示例标记为属于两个类别中的一个或另一个,SVM训练算法构建将新示例分配给一个类别或另一个类别的模型,使其成为非概率二元线性分类器。

SVM的流程? 

使用SVM作为模型时,通常采用如下流程:

  1. 对样本数据进行归一化
  2. 应用核函数对样本进行映射(最常采用和核函数是RBF和Linear,在样本线性可分时,Linear效果要比RBF好)
  3. 用cross-validation和grid-search对超参数进行优选
  4. 用最优参数训练得到模型
  5. 测试
添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子