朴素贝叶斯算法的简单理解和介绍
2020-07-01
2187
贝叶斯分类是一类分类算法的总称,这类算法都是以贝叶斯定理为基础,所以统称为贝叶斯分类。贝叶斯分类中最简单,同时也是常见的一种分类方法就是朴素贝叶斯分类。下面小编来简单介绍一下朴素贝叶斯分类。
一、朴素贝叶斯是基于概率论的分类算法。虽然原理简单,也很容易实现,平时多用于文本分类,比如垃圾邮件过滤。
朴素贝叶斯分类算法,它的核心算法是--贝叶斯公式
朴素贝特斯公式为
二、朴素贝叶斯的优缺点
优点:
(1) 算法逻辑简单,只要使用贝叶斯公式转化即可,易于实现
(2)假设各特征之间相互独立,只涉及到二维存储,分类过程中时空开销小
缺点:
朴素贝叶斯中的朴素一词的来源就是假设各特征之间相互独立。这一假设使得朴素贝叶斯算法变得简单,但有时会牺牲一定的分类准确率。
三、朴素贝叶斯的实际应用
高斯分布型:用于classification问题,假定属性/特征服从正态分布的。
多项式型:用于离散值模型里。
伯努利型:最后得到的特征只有0(没出现)和1(出现过)。