热线电话:13121318867

登录
2020-05-25 阅读量: 930
RandomForestClassifier和MissForest各是什么呢?

RandomForestClassifier是随机森林模型

clf = RandomForestClassifier(n_estimators=200, criterion='entropy', max_depth=4)


RandomForestClassifier函数的参数含义详解:

n_estimators : integer, optional (default=10)  整数,可选择(默认值为10)。

criterion : string, optional (default=”gini”) 字符串,可选择(默认值为“gini”)。

max_features : int, float, string or None, optional (default=”auto”)  整数,浮点数,字符串或者无值,可选的(默认值为"auto")

max_depth : integer or None, optional (default=None)  整数或者无值,可选的(默认为None)

min_samples_split : int, float, optional (default=2)   整数,浮点数,可选的(默认值为2)

missForest是一种非参数的缺失值填补方法

missForest的思路是:利用已知的变量数据当作特征,将缺失值的变量当作标签。其中在标签中有数值的数据为训练集,缺失数据标签部分为测试集。然后通过随机森林预测去更新缺失值

13.7447
4
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子