理解二项逻辑回归

詹惠儿

2019-01-14 阅读量: 966

理解二项逻辑回归

先决条件： 线性回归
本文讨论了Logistic回归的基础知识及其在Python中的实现。逻辑回归基本上是监督分类算法。在分类问题中，目标变量（或输出）y只能为给定的一组特征（或输入）X采用离散值。
我们也可以说目标变量是分类的。根据类别数量，Logistic回归可分为：

二项式：目标变量只能有两种可能的类型：“0”或“1”代表“赢”与“损失”，“通过”与“失败”，“死”与“活着”等。
多项式：目标变量可以具有3种或更多种未被排序的可能类型（即类型没有定量意义），如“疾病A”对“疾病B”对“疾病C”。
序数：它处理具有有序类别的目标变量。例如，测试分数可以分类为：“非常差”，“差”，“好”，“非常好”。在这里，每个类别可以给出分数，如0,1,2,3。

首先，我们探索最简单的Logistic回归形式，即二项Logistic回归。
二项Logistic回归
考虑一个示例数据集，该数据集将学习小时数与考试结果进行映射。结果只能采用两个值，即传递（1）或失败（0）：

ie y是一个分类目标变量，它只能采用两种可能的类型：“0”或“1”。

为了概括我们的模型，我们假设：

数据集具有'p'特征变量和'n'观察值。
特征矩阵表示为：

$\mathbf{X} =\begin{pmatrix} 1 & x_{11} & \cdots & x_{1p} \\ 1 & x_{21} & \cdots & x_{2p} \\ \vdots & \vdots & \ddots & \vdots \\ 1 & x_{n1} & \cdots & x_{np} \end{pmatrix}$

0.0000

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子