田齐齐

2020-03-31   阅读量: 773

机器学习

机器学习:数据不平衡的权重问题

扫码加入数据分析学习群

问:模型权重不是模型会更容易识别出来那些数据类型,跟测试集的权重没关系吗,就像我们之前学习的不平衡数据集的处理方法?

答:数据不平衡是从Y值标签来的,这里和我们的adaboost里讲的比较相似。在adaboost里面,我们是更改错误样本的权重,使得模型更加小心的对待错误的样本,尝试将他们预测正确。对数据不平衡来说,也可以用相同的思想。将少数类的样本权重增大,使得模型会自己更改,从而尽量的将少数类给判断正确,整体将降低误差 。

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
36.8426 6 3 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子