2020-07-17
阅读量:
937
python:决策树模型特征选取方法中选择不同的不纯度计算方法分别代表使用什么算法?
问题;决策树模型特征选取方法中选择不同的不纯度计算方法分别代表使用什么算法?
解答:通常选择gini,即CART算法,如果选择entropy,则代表ID3和C4,.5算法
那么平时怎么选取这个参数呢?
通常就使用基尼系数就可以了
如果数据维度很大,噪声很大时使用基尼系数
如果维度低,数据比较清晰的时候,信息熵和基尼系数没区别
当决策树的拟合程度不够的时候,使用信息熵
两个可以都试试,不好就换另外一个






评论(0)


暂无数据
推荐帖子
2条评论
0条评论
2条评论