【机器学习】逻辑回归原理及其实现-CDA数据分析师官网

【机器学习】逻辑回归原理及其实现

2018-03-28

逻辑回归是最简单的机器学习模型，常常应用于各种简单的任务中。这里记录逻辑回归的背景以及学习方法，权当自己的学习记录总结。

逻辑回归：首先，它不是一个回归模型，而是一个分类模型，它是被用来做分类的。之所以称之为回归，是因为它的学习的是模型模型的参数以最佳拟合已有的数据。（比如，根据已有的一些点，回归出它的直线参数的拟合过程，就称之为回归。）

学习方法：梯度上升法，随机梯度上升法。

模型特点:
1. 优点：训练快、易理解、易实现
2. 缺点：模型不够强大、拟合能力有限，欠拟合，对于复杂的任务效果不够好

在二分类的模型中，我们能最希望的函数是一个二值化函数，也就是
h(x) = 0 当 x > 阈值，h(x)=1 当 x < 阈值
函数下图所示：

然而，虽然这个函数是我们很想学习到的函数，但是由于它在阈值点处的跳跃性（不连续性），使得它变得不好处理（比如在该点处没有导数（梯度）的问题）。
幸好，自然是美好的，我们可以用其它的函数来近似这个函数，Sigmoid 函数就是一个很好的近似方法
其函数图形如下所示（值阈（0–>1）)

函数表达式为:

相比于原始的二值化函数，sigmoid函数具有处处连续、可导的优点。

为了实现逻辑回归分类器，我们将每个特征都乘以一个回归系数wi，然后将结果相加得到一个值，并将这个值带入到sigmoid函数中，就会得到一个0–>1之间的数值，而大于0.5的值被分为1类，小于0.5的被分为0类。所以，逻辑回归也被称之为一个概率估计模型。

在已经确定了分类器模型的函数形式之后，问题就在于如何学习以获得最佳的回归系数？

主要是采用梯度上升及其变形的方法。
它的思想是：要找到某个函数的最大值，最好的方法就是沿着该函数的梯度方向进行寻找。（要有梯度就要求待计算的点有定义并且可导，所以二值化函数不能使用。）
权重更新：

其中alpha为步长，学习（训练）的停止条件一般为：迭代到达一定的次数，或者算法已经到达了一定的误差范围之内。

注意区别于梯度下降法：跟梯度上升法是相同的道理，加法变为减法。

随机梯度上升法：因为梯度上升法在每次更新回归系数的时候都需要遍历整个数据集合，当数据很多的时候，就不适用了，改进的方法为：一次只使用一个样本来更新回归系数，这种方法称之为随机梯度上升法。

只是它用来寻找最小值（一般是loss最小），而梯度上升法用来寻找最大值。

所以总的来说，逻辑回归的计算方法很简单，就分为两步：1，计算梯度，2，更新权值。

具体的权重更新方法为：

具体的代码如下（python）：

def sigmoid(x):
    '''
    逻辑回归的判别函数
    '''
    return 1.0/(1.0+exp(-x))

def gradientAscent(datas,labels):
    '''
    输入参数datas：训练数据矩阵，每一行为一个数据
    输入参数labels：标签数据，为一个值。
    要求参数数据匹配
    '''
    dataX = mat(datas)
    #每列代表一个特征，每行代表不同的训练样本。
    dataY = mat(labels).transpose()
    #标签，将行向量转置为列向量
    m,n = shape(dataX)
    alpha = 0.001
    #步长，也就是学习率
    itera_num = 1000
    #迭代次数
    W = ones((n,1))
    for i in range(itera_num):
        H = sigmoid(dataX * W)
        # H 是一个列向量，元素个数==m
        error = dataY - H
        W = W + alpha * X.transpose()*error
    return W

def stochasticGradientAscent(datas,labels):
    dataX = mat(datas)
    #每列代表一个特征，每行代表不同的训练样本。
    dataY = mat(labels).transpose()
    #标签，将行向量转置为列向量
    m,n = shape(datas)
    alpha = 0.01
    W = ones(n)
    for i in range(m):
        h = sigmoid(sum(dataX[i]*W))
        error = dataY[i] - h
        W = W + alpha * error *dataX[i]
    return W
总结：逻辑回归的目的是为了寻找非线性函数Sigmoid的最佳拟合参数中的权值w，其w的值通过梯度上升法来学习到。随机梯度上升一次只处理少量的样本，节约了计算资源同时也使得算法可以在线学习。

逻辑回归特征机器学习 python 欠拟合概率估计

数据分析咨询请扫描二维码

上一篇我们分析了1.2万个童年梦想，发现多数都被别人实现了

下一篇人脸识别中的机器学习

【机器学习】逻辑回归原理及其实现

考试指南

报考指南

热门栏目

最新资讯

政府、国央企、科研单位——中国航信-面向测试度量 ...

CDA内训丨深圳迈瑞生物医疗数据分析统计思维培训 ...

CDA数据分析师应合肥阳光新能源科技有限公司邀约开 ...

CDA走进海尔大学

苏州中行&CDA数据分析师开展数据分析师培训 ...

中国银行江苏分行-大数据应用培训

浙江农信数据建模及案例应用培训

华夏银行信用卡中心-机器学习培训

字节跳动-CDA案例实操及行业分析

长沙银行-Python集训营

数据分析在业务中的三大应用场景

AI提示词的使用方法详解及示例

CDA立足未来职场，拓展前沿视野

CDA 塑造未来职涯：构筑未来职业发展的数字基石 ...

随机森林（Random Forest）算法的优点和缺点都有哪 ...

方差分析的基本思想和原理是什么？

发现了一个好用到爆的数据分析利器

自从搞懂了回调函数，我对Python的理解上了一个台阶 ...

2020在学硕士达300万，失去学历光环的新生代何去何 ...

缓解就业焦虑的利器，证书真的越多越有保障吗？ ...