2020-03-03
阅读量:
711
SMOTE相关问题
一、问题描述
SMOTE是不是通过增加少数类样本相近的样本达到样本均衡问题,增加到什么程度?
二、问题解答
是的。类别不平衡问题,顾名思义,即数据集中存在某一类样本,其数量远多于或远少于其他类样本,从而导致一些机器学习模型失效的问题。例如逻辑回归即不适合处理类别不平衡问题,例如逻辑回归在欺诈检测问题中,因为绝大多数样本都为正常样本,欺诈样本很少,逻辑回归算法会倾向于把大多数样本判定为正常样本,这样能达到很高的准确率,但是达不到很高的召回率。需要通过smote增加少数样本,到数据均衡的程度。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论