2019-01-14
阅读量:
937
理解二项逻辑回归
先决条件: 线性回归
本文讨论了Logistic回归的基础知识及其在Python中的实现。逻辑回归基本上是监督分类算法。在分类问题中,目标变量(或输出)y只能为给定的一组特征(或输入)X采用离散值。
我们也可以说目标变量是分类的。根据类别数量,Logistic回归可分为:
- 二项式:目标变量只能有两种可能的类型:“0”或“1”代表“赢”与“损失”,“通过”与“失败”,“死”与“活着”等。
- 多项式:目标变量可以具有3种或更多种未被排序的可能类型(即类型没有定量意义),如“疾病A”对“疾病B”对“疾病C”。
- 序数:它处理具有有序类别的目标变量。例如,测试分数可以分类为:“非常差”,“差”,“好”,“非常好”。在这里,每个类别可以给出分数,如0,1,2,3。
首先,我们探索最简单的Logistic回归形式,即二项Logistic回归。
二项Logistic回归
考虑一个示例数据集,该数据集将学习小时数与考试结果进行映射。结果只能采用两个值,即传递(1)或失败(0):
ie y是一个分类目标变量,它只能采用两种可能的类型:“0”或“1”。
为了概括我们的模型,我们假设:
- 数据集具有'p'特征变量和'n'观察值。
- 特征矩阵表示为:






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论