hunter.Z

2021-03-22   阅读量: 1744

Python Scikit-learn

关于网格搜索模型性能降低的问题

扫码加入数据分析学习群

老师,决策树中,利用网格搜索进行了整体调参,为什么调参后的模型在测试集上的得分会降低?而且降低了近10个百分点。模型已经设置了随机数种子。


答:这里需要明确两个问题,1、网格搜索的方法获得的最优参数为交叉验证中分数最高的一组参数,对于整体数据不一定适用。

2、要想模型能有更好的参数,那就需要保证要搜索的参数网格范围足够的大,因为网格搜索只能找到给定范围内的最优参数组合。


当然具体问题具体分析,还需根据代码具体确定问题。代码见文件:

Untitled.txt

可以使用 clf.get_params( ) 方法查看模型的超参数情况,并与网格搜索中的params比对,params的参数范围不能囊括clf.get_params( ) 的值,所以有可能导致无法获得最优参数。并且网格搜索使用了交叉验证,因此最优参数是在交叉数据集上的表现,与整体训练数据的表现也会有些出入的。


200.0000 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子