liting李

2021-04-22   阅读量: 510

数据分析师

机器学习 测试集正确率越高就代表这个模型越好吗?

扫码加入数据分析学习群

这种观点是不对的,并不是说在测试机上精度越高的模型就一定越好,尤其是这种正负样本差距可能会很大的问题。

比如你这个癌症的发病率在样本里总共才10%,那么一个一直判断为没有癌症的模型就能够获得90%的精度,但显然这种模型没有任何的作用。

现实里对这种问题,你可以先解决数据不均衡的问题,像是修改loss的计算或者重复采样之类的最后评判模型的好坏的时候,不要去看模型的正确率,而是去看看每种模型的查准率、回收率或者AUC(Area under Curve):Roc曲线下的面积



添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
109.0882 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子