2020-03-19
阅读量:
1123
机器学习:对于样本不均衡的数据集应该怎样处理
模型天生会倾向于识别多数类, 但是在我们的大多数不均衡数据集中, 少类样本才是我们真正想要去识别的类别.
解决方案:
1. 构建一个新的模型效果评估体系, 去评估模型对于少类样本的识别情况.
- 混淆矩阵
- 精准度
- 召回率
- f1-score
2. 解决数据集中的类别不均衡问题
- 采用采样法: 上采样(SOMTE采样法), 下采样
- 调整类别在模型中的权重比例






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论