京公网安备 11010802034615号
经营许可证编号:京B2-20210330
今天小编给大家分享的文章是:为什么我们的神经网络需要激活函数。神经网络是机器学习里极为重要的一门技术。学习神经网络不仅能让让我们掌握一门强大的机器学习方法,还有利于我们理解深度学习技术。希望通过这篇文章能让大家对神经网络有一个更深刻的理解,对大家的机器学习有所帮助。
文章来源: DeepHub IMBA微信公众号
作者:P**nHub兄弟网站
如果你正在读这篇文章,那么很可能你已经知道什么是神经网络,什么是激活函数,但是,一些关于机器学习的入门课程并不能很清楚地说明,为什么我们需要这些激活函数。我们需要它们吗?没有它们,神经网络还能工作吗?
首先让我们回顾一下关于神经网络的一些事情。它们通常被可视化地表示为一个类似图表的结构,如下图所示:
如上图所示,神经网络有3层:输入层、隐藏层、输出层,共3、4、2个神经元。输入层的节点数量与数据集的特性数量相同。对于隐藏层,您可以自由选择需要多少节点,并且可以使用多个隐藏层。
网络中的每个神经元,除了那些在输入层的神经元,可以被认为是一个线性分类器,它将前一层神经元的所有输出作为输入,并计算这些输出加上一个偏置项的加权和。然后,下一层的神经元将前一层线性分类器计算的值作为输入,然后计算这些值的加权和,依此类推。我们希望,通过以这种方式结合线性分类器,我们可以构建更复杂的分类器,可以代表我们的数据中的非线性模式。
让我们看看下面的例子数据集:
这个数据集不是线性可分的,我们不能将一个类从另一个通过一条线分开。但我们可以通过使用两条线作为决策边界来实现这种分离。
所以,我们可能认为两个中间神经元可以完成这个工作。这两个神经元将学习上图中的两条分离线。然后我们需要一个输出神经元它将之前的两个神经元作为输入,这样它就能正确地进行分类。
对于最后一个做正确分类的神经元,它需要n1和n2隐藏神经元的输出是线性可分的,如果我们把它们画在一个二维平面上。上面画的两条线有方程:
这意味着这两个隐藏的神经元正在计算输入x1和x2的如下线性组合:
我们画出n1和n2看看它们是否有用。
我们对我们的小神经网络感到失望。n1和n2的输出仍然不是线性可分的,因此输出神经元不能正确分类。那么,问题是什么呢?
问题是,任何线性函数的线性组合仍然是线性的,在一张纸上证明它是正确的并不难。这一事实的证据在本文的结尾。所以,不管我们用了多少层或多少神经元,按照我们目前的方式,我们的神经网络仍然只是一个线性分类器。
我们需要更多的东西。我们需要将每个神经元计算出的加权和传递给一个非线性函数,然后将这个函数的输出看作那个神经元的输出。这些函数称为激活函数,它们在允许神经网络学习数据中的复杂模式时非常重要。
[1] 已经证明,具有2层(输入层除外)和非线性激活函数的神经网络,只要在这些层中有足够多的神经元,就可以近似任何函数。那么,如果只有两层就够了,为什么人们现在还在使用更深层次的网络呢?嗯,仅仅因为这两层网络“能够”学习任何东西,这并不意味着它们很容易优化。在实践中,如果我们的网络产能过剩,他们就会给我们提供足够好的解决方案,即使他们没有尽可能地优化。
还有更多种类的激活函数,我们想在上面的示例中使用其中的两种。它们分别是ReLU(直线单元)和tanh(双曲正切),如下图所示。
如果我们在示例中使用ReLU激活,将会发生什么?下图是应用ReLU激活后n1和n2神经元的输出。
现在,我们的这两类点可以用直线分开,这样输出神经元就可以正确地对它们进行分类。
如果我们使用tanh激活,也会发生类似的事情,但这次我们的点之间的差距更大。
同样,输出神经元可以正确地分类这些点。
这里有一个简单的数学证明,证明任何线性函数的线性组合仍然是线性的:
其中a0, a1,…,an是不依赖于输入x1,…,xn的常数。
我希望这篇文章对你有用,谢谢阅读!
参考
[1] Cybenko, G.V. (2006). “Approximation by Superpositions of a Sigmoidal function”. In van Schuppen, Jan H. (ed.). Mathematics of Control, Signals, and Systems. Springer International. pp. 303–314.
作者:Dorian Lazar
deephub翻译组
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22