热线电话:13121318867

登录
2020-07-17 阅读量: 937
python:决策树模型特征选取方法中选择不同的不纯度计算方法分别代表使用什么算法?

问题;决策树模型特征选取方法中选择不同的不纯度计算方法分别代表使用什么算法?

image.png

解答:通常选择gini,即CART算法,如果选择entropy,则代表ID3和C4,.5算法

那么平时怎么选取这个参数呢?


通常就使用基尼系数就可以了

如果数据维度很大,噪声很大时使用基尼系数

如果维度低,数据比较清晰的时候,信息熵和基尼系数没区别

当决策树的拟合程度不够的时候,使用信息熵

两个可以都试试,不好就换另外一个




40.7117
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子