2018-12-16
阅读量:
793
C4.5比 ID3 算法的改进
对数据集排
序
以每个数据
为阈值划分
数据集
计算各划分
的信息增益
根据最大增
益选择阈值
使用阈值对
数据集进行
划分
欢迎加入非盈利Python编程学习交流QQ群783462347,群里免费提供500+本Python书籍!
使用信息增益比例而非信息增益作为分裂标准
处理含有带缺失值的样本方法为将这些值并入最常见的某一类中或以最常用的值代替
处理连续值属性
规则的产生:规则集存储于一个二维数组中,每一行代表决策树的一个规则
交互验证: 训练开始之前,预留一部分数据, 训练之后,使用这部分数据对学习的结果进行验证






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论