这种观点是不对的,并不是说在测试机上精度越高的模型就一定越好,尤其是这种正负样本差距可能会很大的问题。
比如你这个癌症的发病率在样本里总共才10%,那么一个一直判断为没有癌症的模型就能够获得90%的精度,但显然这种模型没有任何的作用。
现实里对这种问题,你可以先解决数据不均衡的问题,像是修改loss的计算或者重复采样之类的最后评判模型的好坏的时候,不要去看模型的正确率,而是去看看每种模型的查准率、回收率或者AUC(Area under Curve):Roc曲线下的面积
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar