热线电话:13121318867

登录
2019-02-28 阅读量: 1004
训练集/测试集的划分方法有哪些?

问、训练集/测试集的划分方法有哪些?

✓ 根据已有标注数据,随机选出一部分数据(比如70%)作为训练数据,余下的作为测试数据。此外还有交叉验证法,自助法用来评估分类模型

分层抽样法:分层抽样法也叫类型抽样法。它是从一个可以分成不同子总体(或称为层)的总体中,按规定的比例从不同层中随机抽取样品(个体)的方法。这种方法的优点是,样本的代表性比较好,抽样误差比较小。缺点是抽样手续较简单随机抽样还要繁杂些。定量调查中的分层抽样是一种卓越的概率抽样方式,在调查中经常被使用。

✓ 交叉验证法先将数据集D划分为k个大小相似的互斥子集,每个子集都尽可能保持数据分布的一致性,即从D中通过分层采样得到。然后,每次用k-1个子集的并集作为训练集,余下的那个子集作为测试集;这样就可获得k组训练/测试集,从而可进行k次训练和测试,最终返回的是这个k个测试结果的均值

✓ 通常把交叉验证法称为“k折交叉验证”, k最常用的取值是10,此时称为10折交叉验证

0.0000
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子