热线电话:13121318867

登录
2020-03-30 阅读量: 836
训练集和测试集的关系

一般来说,训练集用来估计模型中的参数,使模型能够反映现实,进而预测未来或其他未知的信息,而测试集用来评估模型的预测性能。

协同过滤推荐算法的训练集划分不是基于用户的,而是基于值的,即【用户,项目,评分】三元组。如果训练集为80%,测试集为20%,我们就可以将用户-项目评分中的80%抽取出来作为训练集,没抽取的那20%当做测试集(这些项目的值在训练集中表示为不存在)。

假如,某用户-项目评分矩阵中有100个项目,其中用户张三购买并评价了20个项目,也就是有80个项目未购买。这时,我们将20个项目中抽取80%,也就是16个项目作为训练集,另外4个项目作为测试集。即假设张三只购买并评价了100个项目中的16个项目,实际上已经购买的那4个项目就当做未购买。

9.0403
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子