为什么我们的神经网络需要激活函数-CDA数据分析师官网

热线电话：13121318867

为什么我们的神经网络需要激活函数

2020-07-30

今天小编给大家分享的文章是：为什么我们的神经网络需要激活函数。神经网络是机器学习里极为重要的一门技术。学习神经网络不仅能让让我们掌握一门强大的机器学习方法，还有利于我们理解深度学习技术。希望通过这篇文章能让大家对神经网络有一个更深刻的理解，对大家的机器学习有所帮助。

文章来源： DeepHub IMBA微信公众号

作者：P**nHub兄弟网站

如果你正在读这篇文章，那么很可能你已经知道什么是神经网络，什么是激活函数，但是，一些关于机器学习的入门课程并不能很清楚地说明，为什么我们需要这些激活函数。我们需要它们吗?没有它们，神经网络还能工作吗?

首先让我们回顾一下关于神经网络的一些事情。它们通常被可视化地表示为一个类似图表的结构，如下图所示:

如上图所示，神经网络有3层:输入层、隐藏层、输出层，共3、4、2个神经元。输入层的节点数量与数据集的特性数量相同。对于隐藏层，您可以自由选择需要多少节点，并且可以使用多个隐藏层。

网络中的每个神经元，除了那些在输入层的神经元，可以被认为是一个线性分类器，它将前一层神经元的所有输出作为输入，并计算这些输出加上一个偏置项的加权和。然后，下一层的神经元将前一层线性分类器计算的值作为输入，然后计算这些值的加权和，依此类推。我们希望，通过以这种方式结合线性分类器，我们可以构建更复杂的分类器，可以代表我们的数据中的非线性模式。

让我们看看下面的例子数据集:

这个数据集不是线性可分的，我们不能将一个类从另一个通过一条线分开。但我们可以通过使用两条线作为决策边界来实现这种分离。

所以，我们可能认为两个中间神经元可以完成这个工作。这两个神经元将学习上图中的两条分离线。然后我们需要一个输出神经元它将之前的两个神经元作为输入，这样它就能正确地进行分类。

对于最后一个做正确分类的神经元，它需要n1和n2隐藏神经元的输出是线性可分的，如果我们把它们画在一个二维平面上。上面画的两条线有方程:

这意味着这两个隐藏的神经元正在计算输入x1和x2的如下线性组合:

我们画出n1和n2看看它们是否有用。

我们对我们的小神经网络感到失望。n1和n2的输出仍然不是线性可分的，因此输出神经元不能正确分类。那么，问题是什么呢?

问题是，任何线性函数的线性组合仍然是线性的，在一张纸上证明它是正确的并不难。这一事实的证据在本文的结尾。所以，不管我们用了多少层或多少神经元，按照我们目前的方式，我们的神经网络仍然只是一个线性分类器。

我们需要更多的东西。我们需要将每个神经元计算出的加权和传递给一个非线性函数，然后将这个函数的输出看作那个神经元的输出。这些函数称为激活函数，它们在允许神经网络学习数据中的复杂模式时非常重要。

[1] 已经证明，具有2层(输入层除外)和非线性激活函数的神经网络，只要在这些层中有足够多的神经元，就可以近似任何函数。那么，如果只有两层就够了，为什么人们现在还在使用更深层次的网络呢?嗯，仅仅因为这两层网络“能够”学习任何东西，这并不意味着它们很容易优化。在实践中，如果我们的网络产能过剩，他们就会给我们提供足够好的解决方案，即使他们没有尽可能地优化。

还有更多种类的激活函数，我们想在上面的示例中使用其中的两种。它们分别是ReLU(直线单元)和tanh(双曲正切)，如下图所示。

如果我们在示例中使用ReLU激活，将会发生什么?下图是应用ReLU激活后n1和n2神经元的输出。

现在，我们的这两类点可以用直线分开，这样输出神经元就可以正确地对它们进行分类。

如果我们使用tanh激活，也会发生类似的事情，但这次我们的点之间的差距更大。

同样，输出神经元可以正确地分类这些点。

这里有一个简单的数学证明，证明任何线性函数的线性组合仍然是线性的:

其中a0, a1，…，an是不依赖于输入x1，…，xn的常数。

我希望这篇文章对你有用，谢谢阅读!

参考

[1] Cybenko, G.V. (2006). “Approximation by Superpositions of a Sigmoidal function”. In van Schuppen, Jan H. (ed.). Mathematics of Control, Signals, and Systems. Springer International. pp. 303–314.

作者：Dorian Lazar

deephub翻译组

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

神经网络机器学习深度学习

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇SVM算法原理是什么？如何实现？

下一篇数据可视化｜用散点图进行数据分析

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

为什么我们的神经网络需要激活函数

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】聚类分析与主成分分析（PCA）核心区别全 ...

【CDA干货】K-Means++初始化方法全解析：原理、实操 ...

CDA数据分析师：以专业能力搭建高效指标体系，赋能 ...

CDA一级知识点汇总手册：第5章业务数据的特征、处 ...

CDA一级知识点汇总手册：第4章战略与业务数据分析 ...

CDA一级知识点汇总手册：第3章商业数据分析框架 ...

CDA一级知识点汇总手册：第2章数据分析方法 ...

CDA一级知识点汇总手册：第1章数据分析思维 ...

【CDA干货】统计模型的分类与应用场景全解析：从理 ...

【CDA干货】SELECT * 与指定个别字段查询效率深度分 ...

指标体系：CDA数据分析师的核心能力载体，用体系化 ...

【CDA干货】Power BI函数大全：分类、实操与实战全 ...

【CDA干货】次日留存率计算公式：原理、实操与应用 ...

指标的基本概念：CDA数据分析师的实操根基与洞察抓 ...

【CDA干货】随机森林特征重要性：原理、实操与应用 ...

【CDA干货】MySQL按日期分组：保证每天都有数据，无 ...

描述性统计：CDA数据分析师的入门必修课，让数据特 ...

【马年宠粉｜集赞0元领】转发CDA真题海报，水杯/颈 ...

【CDA干货】Anaconda下载库慢？3种实操方法，彻底解 ...

【CDA干货】Tableau两表未连接部分显示0而非Null： ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

为什么我们的神经网络需要激活函数

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】聚类分析与主成分分析（PCA）核心区别全 ...

【CDA干货】K-Means++初始化方法全解析：原理、实操 ...

CDA数据分析师：以专业能力搭建高效指标体系，赋能 ...

CDA一级知识点汇总手册：第5章 业务数据的特征、处 ...

CDA一级知识点汇总手册：第4章 战略与业务数据分析 ...

CDA一级知识点汇总手册：第3章 商业数据分析框架 ...

CDA一级知识点汇总手册：第2章 数据分析方法 ...

CDA一级知识点汇总手册：第1章 数据分析思维 ...

【CDA干货】统计模型的分类与应用场景全解析：从理 ...

【CDA干货】SELECT * 与指定个别字段查询效率深度分 ...

指标体系：CDA数据分析师的核心能力载体，用体系化 ...

【CDA干货】Power BI函数大全：分类、实操与实战全 ...

【CDA干货】次日留存率计算公式：原理、实操与应用 ...

指标的基本概念：CDA数据分析师的实操根基与洞察抓 ...

【CDA干货】随机森林特征重要性：原理、实操与应用 ...

【CDA干货】MySQL按日期分组：保证每天都有数据，无 ...

描述性统计：CDA数据分析师的入门必修课，让数据特 ...

【马年宠粉｜集赞0元领】转发CDA真题海报，水杯/颈 ...

【CDA干货】Anaconda下载库慢？3种实操方法，彻底解 ...

【CDA干货】Tableau两表未连接部分显示0而非Null： ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载

CDA一级知识点汇总手册：第5章业务数据的特征、处 ...

CDA一级知识点汇总手册：第4章战略与业务数据分析 ...

CDA一级知识点汇总手册：第3章商业数据分析框架 ...

CDA一级知识点汇总手册：第2章数据分析方法 ...

CDA一级知识点汇总手册：第1章数据分析思维 ...