2020-03-18
阅读量:
2364
knn算法里是如何处理数据不平衡问题的
knn算法里处理数据不平衡问题是通过weights参数来平衡的。
sklearn.neighbors.KNeighborsClassifier(n_neighbors=5, weights=’uniform’)
weights:用于标识每个样本的近邻样本的权重,可选择"uniform",“distance” 或自定义权重。默认"uniform",所有最近邻样本权重都一样。
如果是"distance",则权重和距离成反比例;如果样本的分布是比较成簇的,即各类样本都在相对分开的簇中时,我们用默认的"uniform"就可以了,如果样本的分布比较乱,规律不好寻找,选择"distance"是一个比较好的选择.






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论