如何学习机器学习的数学知识-CDA数据分析师官网

热线电话：13121318867

首页大数据时代如何学习机器学习的数学知识

如何学习机器学习的数学知识

2022-02-16

数据科学有志之士最常见的问题之一是 "对于机器学习，我需要知道多少数学？" 希望进入机器学习领域的学生往往将数学视为一个巨大的入门障碍。

行业中的守门人对这种担忧没有帮助，他们给学生贴上了不合格的标签，除非他们拥有该学科的硕士或博士学位。

那么，为了在数据科学行业工作，你需要知道多少数学？

答案是。没有你想象的那么多。

大多数公司在数据的帮助下解决非常类似的用例。他们要求数据科学家建立机器学习模型，可以预测客户流失，进行细分，并预测销售。

用于解决这些问题的方法是相似的，而且任务变得相当重复。没有必要重新发明轮子，他们使用开箱即用的ML算法。

即使出现了需要建立自定义机器学习模型的情况，对特定主题的直观理解也是足够的。你不需要去深究，也绝对不需要成为数学专家来成为数据科学家。

例如，我们知道梯度下降是用来寻找线性回归中的最佳拟合线的。你不需要开始学习如何解决微分方程，你只需要了解微积分的原理，就可以了解到这是如何做到的。

同样，如果你要用Tensorflow构建一个神经网络--你需要进行大量的矩阵操作，但你将在计算机程序的帮助下进行。由于这个原因，你不需要回去练习解代数方程。你只需要了解它们是如何工作的。

在这篇文章中，我将为你指出一些资源，帮助你开始学习数据科学的数学。我将专注于三个领域--线性代数、微积分和统计。

线性代数

线性代数--从基础到前沿。edX上的这门课程将在本科水平上教你线性代数。它从一个缓慢的空间开始，只要你有高中水平的数学知识，你就可以学习这个课程。

这门课程最好的地方是，它用Matlab中的实际例子教你线性代数，这让你通过算法和编程的视角来看待这个学科。如果你的目标是学习机器学习的线性代数，这种学习方法特别有用。

这个课程可以免费试听。如果你想获得结业证书，你可以申请财政援助。

3Blue1Brown--《线性代数精华》：我以前没有上过这门课，但在我自己寻找数学学习资源的过程中，曾多次遇到它。

许多有志于机器学习的人对这门课程深信不疑，因为它为学习者提供了对线性代数的概念性理解。与其学习任意的公式或机械地推导它们，你将获得对线性代数如何工作的直觉。如果你的最终目标是将这些概念应用于机器学习模型，这将是非常有帮助的。

微积分

我推荐两门为机器学习学习微积分的课程。微积分的本质》是3Blue1Brown开设的一门伟大的微积分入门课程。同样，这将为你提供对微积分概念的直观理解，并深入解释公式背后的意义，而不仅仅是让你记住它们。

接下来，你可以学习3Blue1Brown的神经网络系列。如果你知道如何使用Keras等库实现神经网络，但并不真正了解这些模型背后的工作原理，你应该学习这门课程。它为你提供了梯度下降算法的全面解释，以及其背后的微积分概念。

统计数字

概率与统计：To p or not to p? ？-库塞拉

这是我所学过的最好的统计学入门课程之一，由伦敦大学提供。这门课程是针对主修非数学专业的学生，如商业和金融。

正因为如此，统计学概念的解释方式简单易懂，并有许多真实世界的例子。

学习本课程后，你将对描述性和推断性统计、不同的抽样分布、抽样技术、置信区间以及P值的计算方法有所了解。

所有这些概念都可以直接应用于现实世界的数据分析。

统计学习-edX

这是另一个学习机器学习模型背后的直觉的优秀课程。

与本列表中的其他资源一样，本课程不太注重数学公式，而是以概念的方式解释机器学习模型。

然而，要学习这门课程，建议有一些微积分知识，因为导师倾向于使用符号，否则可能会使你感到困惑。

你将学习线性和逻辑回归等概念，以及正则化技术，如脊和套索回归，以及何时使用它们。有一整堂课专门讨论用于减轻过拟合的技术，并解释了这些技术背后的基本数学直觉。

这是我上过的最有帮助的课程之一，因为它帮助我不再把机器学习模型当作黑盒子。我对不同类型的模型应该用在什么地方，什么时候应该应用降维，以及什么时候执行不同种类的特征选择技术有了了解。

我花了很多时间试图回到过去，学习本科阶段的微积分和线性代数。然而，尽管花了很多时间学习公式和解微分方程，我的知识还是有脱节，因为我从来没有完全理解这些概念与机器学习算法的关系。

上述资源是突破这一障碍的好方法，因为它们让你对机器学习背后的数学有一个概念性的理解，而不是把你带入复杂公式和定理的兔子洞。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

机器学习神经网络梯度下降抽样分布正则化过拟合特征逻辑回归

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇数据科学定义的幽默。与数据科学定义相关的奇特语录集锦

下一篇初级数据科学家：下一个层次

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

如何学习机器学习的数学知识

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】OSM指标体系：自上而下拆解逻辑、搭建流 ...

【CDA干货】选择统计方法前最重要的核心工作：避免9 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

【CDA干货】问卷效度高与后续因子分析：逻辑关系、 ...

CDA持证人专访：唐一楠谈应届生数据分析就业与学习 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载