2020-03-25
阅读量:
813
拉普拉斯平滑lambda的取值为什么是0到1?
拉普拉斯校准是给频率表中每个计数加上一个较小的数,保证每个特征发生概率不为0的情况。
假定训练样本很大时,每个分量x的计数加1造成的估计概率变化可以忽略不计,但可以方便有效的避免零概率问题。
应用举例:
假设在文本分类中,有3个类, C1、 C2、 C3,在指定的训练样本中,某个词语K1,在各个类中观测计数分别为0, 990, 10, K1的概率为0, 0.99, 0.01,对这三个量使用拉普拉斯平滑的计算方法如下:
1/1003 = 0.001, 991/1003=0.988, 11/1003=0.011
在实际的使用中也经常使用加 lambda(1≥lambda≥0)来代替简单加1。如果对N个计数都加上lambda,这时分母也要记得加上N*lambda。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论