2020-07-29
阅读量:
3247
贝叶斯算法的优缺点
优点:
1、对待预测样本进行预测,过程简单速度快(想想邮件分类的问题,预测就是分词后进行概率乘积,在log域直接做加法更快)。
2、对于多分类问题也同样很有效,复杂度也不会有大程度上升。
3、在分布独立这个假设成立的情况下,贝叶斯分类器效果奇好,会略胜于逻辑回归,同时我们需要的样本量也更少一点。
4、对于类别类的输入特征变量,效果非常好。对于数值型变量特征,我们是默认它符合正态分布的。
缺点:
1、对于测试集中的一个类别变量特征,如果在训练集里没见过,直接算的话概率就是0了,预测功能就失效了。当然,我们前面的文章提过我们有一种技术叫做『平滑』操作,可以缓解这个问题,最常见的平滑技术是拉普拉斯估测。
2、朴素贝叶斯算出的概率结果,比较大小还凑合。
3、朴素贝叶斯有分布独立的假设前提,而现实生活中这些predictor很难是完全独立的。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论