热线电话:13121318867

登录
2018-12-16 阅读量: 793
C4.5比 ID3 算法的改进

对数据集排

以每个数据

为阈值划分

数据集

计算各划分

的信息增益

根据最大增

益选择阈值

使用阈值对

数据集进行

划分

欢迎加入非盈利Python编程学习交流QQ群783462347,群里免费提供500+本Python书籍!

 使用信息增益比例而非信息增益作为分裂标准

处理含有带缺失值的样本方法为将这些值并入最常见的某一类中或以最常用的值代替

 处理连续值属性

 规则的产生:规则集存储于一个二维数组中,每一行代表决策树的一个规则

 交互验证: 训练开始之前,预留一部分数据, 训练之后,使用这部分数据对学习的结果进行验证

0.0000
3
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子