热线电话:13121318867

登录
2019-03-06 阅读量: 1491
K最近距离邻法填充缺失值优缺点有哪些?

问、K最近距离邻法填充缺失值优缺点有哪些?

答:

由K最近邻分类算法(KNN)演化而来,KNN算法不仅可以用于分类,还可以用于回归。通过找出一个样本的k个最近邻居,将这些邻居的属性的平均值赋给该样本,就可以得到该样本的属性。现在更为科学的是将不同距离的邻居对该样本产生的影响给予不同的权值(weight),如权值与距离成反比。 

优点:得到的缺失值较为科学,准确;

缺点:当样本不平衡时,会导致新样本的K个邻居中大容量类的样本占比多,可使用加权来改善这个问题;还有就是计算量大,可事先去除对分类作用不大的样本。

注:该算法比较适用于样本容量比较大的类域的自动分类,而那些样本容量较小的类域采用这种算法比较容易产生误分。

0.0000
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子