热线电话:13121318867

登录
2019-03-07 阅读量: 2572
什么是热卡填充缺失值?

问、什么是热卡填充缺失值?

答:

对于一个包含空值的对象,热卡填充的做法是:在完整数据中找到一个与它最相似的对象,然后用这个相似对象的值来进行填充。不同的问题可能会选用不同的标准来对相似进行判定。最常见的是使用相关系数矩阵来确定哪个变量(如变量Y)与缺失值所在变量(如变量X)最相关。然后把所有变量按Y的取值大小进行排序。那么变量X的缺失值就可以用排在缺失值前的那个变量Y的数据来代替了。

优点:概念上很简单,且与均值替换法相比,利用热卡填充法插补数据后,其变量的标准差与插补前比较接近。

缺点:操作太麻烦,比较耗时,而且在回归方程中,使用热卡填充法容易使得回归方程的误差增大,参数估计变得不稳定。

0.0000
3
关注作者
收藏
评论(0)

发表评论

暂无数据