京公网安备 11010802034615号
经营许可证编号:京B2-20210330
这篇文章是为那些属于下列类别之一的人准备的:
你可能在想,“我有机会吗?”
答案是:“是的,有可能。”
好消息是,您已经通过了第一步,这就是您对数据科学感兴趣。现在这将不是一个容易的旅程,因为您是一个失败者,但要把它作为每天激励自己的燃料。
最重要的是,我要给你我的建议,我希望我在开始的时候有。
首先,介绍一下我自己…
我有商科学位,但从大学二年级开始,我就对机器学习感兴趣。因此,我自学了我今天所知道的大部分知识,我很幸运地在几个数据分析师/数据科学工作中工作。
我为什么要告诉你这些?我想说清楚,我曾经和你处于类似的位置!
请记住,这是一个长期目标,因此您应该期待长期的结果。如果你愿意付出100%的努力,我会给你至少一年的时间来决定是否继续下去。
说到这里,让我们潜入其中:
进入数据科学可以归结为两件事,增长和展示您的技能。
不久前,我写了一篇文章,“如果我可以重新开始,我将如何学习数据科学。”在这篇文章中,我将学习的内容按学科划分,即统计与数学、编程基础和机器学习。
在这篇文章中,我将根据你的理解水平来划分你应该学习的内容。
级别0:基本原理
你必须从基础开始,构建块,无论你想怎么称呼它。但是相信我,当我说这些的时候,你的基础越好,你的数据科学之旅就会越顺利。
特别是,我建议您在以下主题中建立基础知识:统计与概率、数学和编程。
统计和概率:如果你读过我以前的文章,那么你可能已经听过第一百万次了,但是数据科学家实际上只是一个现代统计学家。
数学:取决于你在高中时的注意力,这将决定你需要花多少时间学习基础数学。您应该学习以下三个方面:微积分、积分和线性代数:
编程:就像对数学和统计数据有一个基本的理解是很重要的一样,了解编程中的核心基础知识会使您的生活变得容易得多,尤其是在实现方面。因此,我建议您在深入研究机器学习算法之前,先花时间学习基本的SQL和Python。
级别1:专门化
一旦你学会了基础知识,你就准备好专门化了。在这一点上,你是否想专注于机器学习算法、深度学习、自然语言处理、计算机视觉等就取决于你了…
你可以专攻的东西还有那么多,所以在你做决定之前,请多探索一下!
第2级:练习
像其他任何事情一样,你必须练习你学到的东西,因为你失去了你不用的东西!以下是我推荐的3个资源,可以用来练习和改进你的技能。
学习数据科学是一回事,但人们通常忘记的是营销自己--你最终会想展示你学到的东西。如果您没有与数据科学相关的学位,这对您来说尤其重要。
一旦你完成了几个个人数据科学项目,下面是你展示它们和推销自己的几种方法:
您的简历
首先,利用你的简历展示你的数据科学项目。我建议创建一个名为“个人项目”的部分,在那里你可以列出你已经完成的两到三个项目。
同样,您也可以在LinkedIn上的“projects”部分添加这些项目。
GitHub存储库
如果您还没有创建Github存储库,我强烈建议您创建一个Github存储库。当我们讨论Github的主题时,学习Git将是一个好主意。在这里,您可以包含所有的数据科学项目,更重要的是,您可以与其他人共享您的代码以供查看。
如果你有一个Kaggle帐户,并在Kaggle上创建笔记本,这也是一个很好的选择。
一旦你有了一个活跃的Kaggle或Github账户,确保你的账户URL在你的简历、领英和网站上都有。
个人网站
说到网站,我强烈建议以网站的形式建立一个数据科学投资组合。HTML和CSS是非常简单的学习,这将是一个有趣的项目!如果你没有时间,像Squarespace这样的东西也会很好地工作。
中型博客
我有偏见,因为这对我来说很有效,但这并不意味着我不能推荐写博客!使用像Medium这样的平台,您可以编写项目演练,就像我的onWine Quality Prediction一样。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26