热线电话:13121318867

登录
2020-03-19 阅读量: 755
对于样本不均衡数据集如何处理?

对于样本不均衡数据集:

模型天生会倾向于识别多数类, 但是在我们的大多数不均衡数据集中, 少类样本才是我们真正想要去识别的类别.

解决方案:

1. 构建一个新的模型效果评估体系, 去评估模型对于少类样本的识别情况.

- 混淆矩阵

- 精准度

- 召回率

- f1-score

2. 解决数据集中的类别不均衡问题

- 采用采样法: 上采样(SOMTE采样法), 下采样

- 调整类别在模型中的权重比例

3.7600
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子