过拟合原因
数据:数据不规范,数据量少,数据穿越,统计特征用到了未来的信息或者标签信息
算法:算法过于复杂
解决:
1、将数据规范化,处理缺失值,增加数据量,采样,添加噪声数据
2、正则化,控制模型复杂程度,
3、early stoping,减少迭代次数,减少树的深度,
4、学习率调大/小点、
5、融合几个模型