扫码加入数据分析学习群
Holdout 检验
Holdout 检验是最简单也是最直接的模型评估验证方法,它将原始的样本集
合随机划分成训练集和验证集两部分。比方说,对于一个点击率预测模
型,我们把样本按照 70% ~ 30% 的比例分成两部分, 70% 的样本用
于模型训练; 30% 的样本用于模型验证,包捂绘制 ROC 曲线、计算精
确率和召回率等指标来评估模型性能。
Holdout 检验的缺点很明显,即在验证集上计算出来的最后评估指
标与原始分组有很大关系。为了消除随机性,研究者们引入了“交叉检
验”的思想 。