2019-03-11
阅读量:
1142
问、C4.5方法处理缺失值的优缺点?
问、C4.5方法处理缺失值的优缺点?
答:
C4.5算法是由Ross Quinlan开发的用于产生决策树的算法。通过寻找属性间的关系来对遗失值填充。它寻找之间具有最大相关性的两个属性,其中没有遗失值的一个称为代理属性,另一个称为原始属性,用代理属性决定原始属性中的遗失值。这种基于规则归纳的方法只能处理基数较小的名词型属性。
优点:产生的分类规则易于理解,准确率较高。
缺点:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。此外,C4.5只适合于能够驻留于内存的数据集,当训练集大得无法在内存容纳时程序无法运行。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论