热线电话:13121318867

登录
2020-03-25 阅读量: 813
拉普拉斯平滑lambda的取值为什么是0到1?

拉普拉斯校准是给频率表中每个计数加上一个较小的数,保证每个特征发生概率不为0的情况。

假定训练样本很大时,每个分量x的计数加1造成的估计概率变化可以忽略不计,但可以方便有效的避免零概率问题。

应用举例:

假设在文本分类中,有3个类, C1、 C2、 C3,在指定的训练样本中,某个词语K1,在各个类中观测计数分别为0, 990, 10, K1的概率为0, 0.99, 0.01,对这三个量使用拉普拉斯平滑的计算方法如下:

1/1003 = 0.001, 991/1003=0.988, 11/1003=0.011

在实际的使用中也经常使用加 lambda(1≥lambda≥0)来代替简单加1。如果对N个计数都加上lambda,这时分母也要记得加上N*lambda。

19.4908
3
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子