2020-05-25
阅读量:
930
RandomForestClassifier和MissForest各是什么呢?
RandomForestClassifier是随机森林模型
clf = RandomForestClassifier(n_estimators=200, criterion='entropy', max_depth=4)
RandomForestClassifier函数的参数含义详解:
n_estimators : integer, optional (default=10) 整数,可选择(默认值为10)。
criterion : string, optional (default=”gini”) 字符串,可选择(默认值为“gini”)。
max_features : int, float, string or None, optional (default=”auto”) 整数,浮点数,字符串或者无值,可选的(默认值为"auto")
max_depth : integer or None, optional (default=None) 整数或者无值,可选的(默认为None)
min_samples_split : int, float, optional (default=2) 整数,浮点数,可选的(默认值为2)
missForest是一种非参数的缺失值填补方法
missForest的思路是:利用已知的变量数据当作特征,将缺失值的变量当作标签。其中在标签中有数值的数据为训练集,缺失数据标签部分为测试集。然后通过随机森林预测去更新缺失值






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论