热线电话:13121318867

登录
2019-03-11 阅读量: 1142
问、C4.5方法处理缺失值的优缺点?

问、C4.5方法处理缺失值的优缺点?

答:

C4.5算法是由Ross Quinlan开发的用于产生决策树的算法。通过寻找属性间的关系来对遗失值填充。它寻找之间具有最大相关性的两个属性,其中没有遗失值的一个称为代理属性,另一个称为原始属性,用代理属性决定原始属性中的遗失值。这种基于规则归纳的方法只能处理基数较小的名词型属性。

优点:产生的分类规则易于理解,准确率较高。

缺点:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。此外,C4.5只适合于能够驻留于内存的数据集,当训练集大得无法在内存容纳时程序无法运行。

0.0000
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子