291294878

2018-10-23   阅读量: 774

数据分析师 统计学

SVM 的推导,特性?多分类怎么处理?

扫码加入数据分析学习群

SVM是最大间隔分类器 从线性可分情况下,原问题,特征转换后的dual问题,引入kernel(线性kernel,多项式,高斯),最后是soft margin。

线性:简单,速度快,但是需要线性可分 多项式:比线性核拟合程度更强,知道具体的维度,但是高次容易出现数值不稳定,参数选择比较多。 高斯:拟合能力最强,但是要注意过拟合问题。不过只有一个参数需要调整。

多分类问题,一般将二分类推广到多分类的方式有三种,一对一,一对多,多对多。

一对一:将N个类别两两配对,产生N(N-1)/2个二分类任务,测试阶段新样本同时交给所有的分类器,最终结果通过投票产生。

一对多:每一次将一个例作为正例,其他的作为反例,训练N个分类器,测试时如果只有一个分类器预测为正类,则对应类别为最终结果,如果有多个,则一般选择置信度最大的。从分类器角度一对一更多,但是每一次都只用了2个类别,因此当类别数很多的时候一对一开销通常更小(只要训练复杂度高于O(N)即可得到此结果)。

多对多:若干个类作为正类,若干个类作为反类。注意正反类必须特殊的设计。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 3 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子