热线电话:13121318867

登录
2018-10-27 阅读量: 813
Logistic 回归

主要用于预测,如:收集了若干人的健康记录,包括年龄、性别、抽烟史、日常饮食及家庭病史等变量的数据,因变量为得了癌症(Y=1),没有得癌症(Y=0)。通过训练得出得癌症和没得癌症的概率拟合公式。当有一批新的数据时,可以根据拟合公式得出是否得癌症的概率。

逻辑回归和决策树的主要差别:

1. 对于拥有缺失值的数据,决策树可以应对,而逻辑回归需要挖掘人员预先对缺失数据进行处理。

2. 逻辑回归对数据整体结构的分析优于决策树,而决策树对局部结构的分析优于逻辑回归。

3. 逻辑回归擅长分析线性关系,而决策树对线性关系的把握较差。线性关系在实践中有很多优点:简洁,易理解,可以在一定程度上防止对数据的过度拟合。

4. 逻辑回归对极值比较敏感,容易受极端值的影响,而决策树在这方面表现较好。

5. 应用上的区别:决策树的结果和逻辑回归相比略显粗糙。逻辑回归原则上可以提供数据中每个观察点的概率,而决策树只能把挖掘对象分为有限的概率组群。比如决策树确定17个节点,全部人口就只能有17个概率,在应用上受到一定限制。就操作来说,决策树比较容易上手,需要的数据预处理较少,而逻辑回归则要求一定的训练和技巧。

6. 执行速度上:当数据量很大的时候,逻辑回归的执行速度非常慢,而决策树的运行速度上明显快于逻辑回归。

0.0000
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子