登录
首页精彩阅读数据挖掘(支持向量机)
数据挖掘(支持向量机)
2016-08-15
收藏

数据挖掘(支持向量机)

支持向量机(Support Vector Machine)是数据挖掘算法中最强壮,最准确的方法之一。它是由Cortes 和 Vapnik 于1995年首先提出来的,它能根据有限的样本信息在 模型的复杂度和学习能力之间寻求最佳折衷。

要理解 SVM 需要一点数学知识,我们先来看看 二维空间的 分类,由图可知,C1 和 C2 两个类可以由一条线一分为二,如果是三维 就应该是一个面了,我们放开维数不管,这样一个划分的分类器叫做“超平面”hyper-plane



我们记这个二维超平面  g(x)= w * x + b 因此,当我们在 C1 类中的点 x1,它的 g(x1) > 0,因此被分到了 C1,而在 C2 类中的点 x2,g(x2)< 0,因此被分到了 C2。是不是很简单。
注意,当我们的维数增加上去的时候,我们会发现,其实 w 表示的是权重向量,b 表示的是最优超平面偏移。当我们对文本分类的时候,一个实例一般由一组属性和一个标记 如 Di = (xi,yi),就可以知道该点到 超平面的 距离 r 也就是 r = g(x1)/ || w || 。
其中 w = (w1,w2,...,wm) cda数据分析师协会

数据分析咨询请扫描二维码

客服在线
立即咨询