2020-09-10
阅读量:
900
python中如何填补缺失值?
填补缺失值,一般来说按列进行填补,首先看的缺失值的比列,有80%以上,50% ~ 80%,小于50%三种。
如果有80%以上的值,缺失值小于20%,简单统计指标进行填补,主要填补方法有数值型(np.mean)、分类型(众数)、层次概念类别(众数,中位数)。
50% ~ 80%,算法模型去填补,KNN,RF,拉格朗日差值,这种模型去填补
小于50%,50%左右,变成另一种变量,缺失了和没缺失(1,0)。
时序的缺失值,一般来说用上下值进行填补。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论