首先,分类和回归同属于监督学习需要完成的任务。
分类与回归最主要的区别是输出变量的类型:连续变量的预测叫回归,离散变量的预测是分类。
回归的主要作用是了解两个或多个变量之间是否相关,相关的方向,相关的强度,并利用数学模型以便观察特定变量来预测研究者感兴趣的变量。分类模型是将回归模型输出离散化,分类和回归模型之间存在重要差异。
答:cart树本身实现的时候就是二分的二叉树,cart算法先对数据进行二分,然后再计算基尼系数这个指标,最后根据基尼系数这个指标去寻找最优切分点。所以cart树的二分与基尼系数、信息增益率无关。