liting李

2021-04-22   阅读量: 25

数据分析师

机器学习 测试集正确率越高就代表这个模型越好吗?

这种观点是不对的,并不是说在测试机上精度越高的模型就一定越好,尤其是这种正负样本差距可能会很大的问题。

比如你这个癌症的发病率在样本里总共才10%,那么一个一直判断为没有癌症的模型就能够获得90%的精度,但显然这种模型没有任何的作用。

现实里对这种问题,你可以先解决数据不均衡的问题,像是修改loss的计算或者重复采样之类的最后评判模型的好坏的时候,不要去看模型的正确率,而是去看看每种模型的查准率、回收率或者AUC(Area under Curve):Roc曲线下的面积



109.0882 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程