2019-03-07
阅读量:
2572
什么是热卡填充缺失值?
问、什么是热卡填充缺失值?
答:
对于一个包含空值的对象,热卡填充的做法是:在完整数据中找到一个与它最相似的对象,然后用这个相似对象的值来进行填充。不同的问题可能会选用不同的标准来对相似进行判定。最常见的是使用相关系数矩阵来确定哪个变量(如变量Y)与缺失值所在变量(如变量X)最相关。然后把所有变量按Y的取值大小进行排序。那么变量X的缺失值就可以用排在缺失值前的那个变量Y的数据来代替了。
优点:概念上很简单,且与均值替换法相比,利用热卡填充法插补数据后,其变量的标准差与插补前比较接近。
缺点:操作太麻烦,比较耗时,而且在回归方程中,使用热卡填充法容易使得回归方程的误差增大,参数估计变得不稳定。






评论(0)


暂无数据
推荐帖子
4条评论
3条评论