啊啊啊啊啊吖

2018-12-16   阅读量: 611

数据分析师 Python数据分析 机器学习

C4.5比 ID3 算法的改进

扫码加入数据分析学习群

对数据集排

以每个数据

为阈值划分

数据集

计算各划分

的信息增益

根据最大增

益选择阈值

使用阈值对

数据集进行

划分

欢迎加入非盈利Python编程学习交流QQ群783462347,群里免费提供500+本Python书籍!

 使用信息增益比例而非信息增益作为分裂标准

处理含有带缺失值的样本方法为将这些值并入最常见的某一类中或以最常用的值代替

 处理连续值属性

 规则的产生:规则集存储于一个二维数组中,每一行代表决策树的一个规则

 交互验证: 训练开始之前,预留一部分数据, 训练之后,使用这部分数据对学习的结果进行验证

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 3 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子