2020-03-25
阅读量:
528
伯努利贝叶斯是不是内部把变量做了哑变量处理?
与多项式模型一样,伯努利模型适用于离散特征的情况,所不同的是,伯努利模型中每个特征的取值只能是1和0(以文本分类为例,某个单词在文档中出现过,则其特征值为1,否则为0).
伯努利模型和多项式模型是一致的,BernoulliNB需要比MultinomialNB多定义一个二值化的方法,该方法会接受一个阈值并将输入的特征二值化(1,0).当然也可以直接采用MultinomialNB,但需要预先将输入的特征二值化.
参数 binarize:将数据特征二值化的阈值
<=binarize的值处理为0,>binarize的值处理为1






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论