拉普拉斯平滑lambda的取值为什么是0到1？_CDA答疑社区

热线电话：13121318867

登录

读童话的狼

2020-03-25 阅读量: 813

拉普拉斯平滑lambda的取值为什么是0到1？

拉普拉斯校准是给频率表中每个计数加上一个较小的数，保证每个特征发生概率不为0的情况。

假定训练样本很大时，每个分量x的计数加1造成的估计概率变化可以忽略不计，但可以方便有效的避免零概率问题。

应用举例：

假设在文本分类中，有3个类， C1、 C2、 C3，在指定的训练样本中，某个词语K1，在各个类中观测计数分别为0， 990， 10， K1的概率为0， 0.99， 0.01，对这三个量使用拉普拉斯平滑的计算方法如下：

1/1003 = 0.001， 991/1003=0.988， 11/1003=0.011

在实际的使用中也经常使用加 lambda（1≥lambda≥0）来代替简单加1。如果对N个计数都加上lambda，这时分母也要记得加上N*lambda。

19.4908

1

3

关注作者

收藏

评论(0)

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子