登录
首页大数据时代没有学位如何进入数据科学
没有学位如何进入数据科学
2022-03-14
收藏

这篇文章是为那些属于下列类别之一的人准备的:

  1. 你没有大专学位,但你对数据科学感兴趣。
  2. 你没有STEM相关的学位,但你对数据科学感兴趣。
  3. 你在一个与数据科学完全无关的领域工作,但你对数据科学感兴趣。
  4. 您只是对数据科学感兴趣,并想了解更多关于它的知识。

你可能在想,“我有机会吗?”

答案是:“是的,有可能。”

好消息是,您已经通过了第一步,这就是您对数据科学感兴趣。现在这将不是一个容易的旅程,因为您是一个失败者,但要把它作为每天激励自己的燃料。

最重要的是,我要给你我的建议,我希望我在开始的时候有。

首先,介绍一下我自己…

我有商科学位,但从大学二年级开始,我就对机器学习感兴趣。因此,我自学了我今天所知道的大部分知识,我很幸运地在几个数据分析师/数据科学工作中工作。

我为什么要告诉你这些?我想说清楚,我曾经和你处于类似的位置!

请记住,这是一个长期目标,因此您应该期待长期的结果。如果你愿意付出100%的努力,我会给你至少一年的时间来决定是否继续下去。

说到这里,让我们潜入其中:

进入数据科学可以归结为两件事,增长展示您的技能。

1)提高数据科学技能

不久前,我写了一篇文章,“如果我可以重新开始,我将如何学习数据科学。”在这篇文章中,我将学习的内容按学科划分,即统计与数学、编程基础和机器学习

在这篇文章中,我将根据你的理解水平来划分你应该学习的内容。

级别0:基本原理

你必须从基础开始,构建块,无论你想怎么称呼它。但是相信我,当我说这些的时候,你的基础越好,你的数据科学之旅就会越顺利。

特别是,我建议您在以下主题中建立基础知识:统计与概率、数学和编程。

统计和概率:如果你读过我以前的文章,那么你可能已经听过第一百万次了,但是数据科学家实际上只是一个现代统计学家。

  • 如果你对统计和数学几乎没有接触,我推荐可汗学院的统计和概率课程。
  • 然而,如果你有一些微积分和积分的知识,我强烈建议你读读佐治亚理工学院的课程,名为“统计方法”。这是一个稍微困难的过程,因为它需要更多的证明,但它将帮助你理解每个想法的复杂性。

数学:取决于你在高中时的注意力,这将决定你需要花多少时间学习基础数学。您应该学习以下三个方面:微积分、积分和线性代数:

  • 当涉及到任何与优化相关的事情(这在数据科学中非常相关)时,微积分是必不可少的。为此我推荐了可汗学院的微积分课程。
  • 当谈到概率分布假设检验时,积分是必不可少的。我推荐了汗学院的积分课程。
  • 如果你想进入深度学习,线性代数尤其重要,但即使这样,了解其他基本的机器学习概念也是很好的,比如主成分分析和推荐系统。惊喜惊喜,你可以猜到我推荐什么课程。这里提供了链接。

编程:就像对数学和统计数据有一个基本的理解是很重要的一样,了解编程中的核心基础知识会使您的生活变得容易得多,尤其是在实现方面。因此,我建议您在深入研究机器学习算法之前,先花时间学习基本的SQLPython

  • 如果您对SQL是完全陌生的,我建议您阅读Mode的SQL教程,因为它非常简洁和全面。
  • 同样,如果您是Python的新手,Codecademy是熟悉Python的好资源。

级别1:专门化

一旦你学会了基础知识,你就准备好专门化了。在这一点上,你是否想专注于机器学习算法、深度学习自然语言处理计算机视觉等就取决于你了…

  • 如果你想了解更多关于机器学习算法和实现的知识,我会去看看Kaggle的机器学习介绍,斯坦福的机器学习课程,或者Udemy上的机器学习A-Z。看看他们,看看什么最适合你的喜好!
  • 如果你想了解更多关于深度学习的信息,在这里查看欧泰的专业化。物有所值!
  • 如果你想学习更多关于NLP的知识,这里有5个免费的自然语言处理课程,来自斯坦福和牛津等顶尖大学。

你可以专攻的东西还有那么多,所以在你做决定之前,请多探索一下!

第2级:练习

像其他任何事情一样,你必须练习你学到的东西,因为你失去了你不用的东西!以下是我推荐的3个资源,可以用来练习和改进你的技能。

  1. Leetcode是一个伟大的资源,它帮助我学习技能和整洁的技巧,我从来没有想过是可能的。这是我在找工作时充分利用的东西,也是我永远会回去的资源。最好的部分是,他们通常有推荐的解决方案和讨论板,因此您可以了解更有效的解决方案和技术。
  2. 熊猫练习问题:这个资源是一个专门针对熊猫的练习问题的存储库。通过完成这些练习问题,您将知道如何:筛选和排序数据、聚合数据、使用.apply()操作数据,等等。
  3. Kaggle是世界上最大的数据科学社区之一,有数百个数据集可供选择。使用Kaggle,您可以参加比赛,或者简单地利用可用的数据集创建自己的机器学习模型。

2)展示你的数据科学技能

学习数据科学是一回事,但人们通常忘记的是营销自己--你最终会想展示你学到的东西。如果您没有与数据科学相关的学位,这对您来说尤其重要

一旦你完成了几个个人数据科学项目,下面是你展示它们和推销自己的几种方法:

您的简历

首先,利用你的简历展示你的数据科学项目。我建议创建一个名为“个人项目”的部分,在那里你可以列出你已经完成的两到三个项目。

同样,您也可以在LinkedIn上的“projects”部分添加这些项目。

GitHub存储库

如果您还没有创建Github存储库,我强烈建议您创建一个Github存储库。当我们讨论Github的主题时,学习Git将是一个好主意。在这里,您可以包含所有的数据科学项目,更重要的是,您可以与其他人共享您的代码以供查看。

如果你有一个Kaggle帐户,并在Kaggle上创建笔记本,这也是一个很好的选择。

一旦你有了一个活跃的Kaggle或Github账户,确保你的账户URL在你的简历、领英和网站上都有。

个人网站

说到网站,我强烈建议以网站的形式建立一个数据科学投资组合。HTML和CSS是非常简单的学习,这将是一个有趣的项目!如果你没有时间,像Squarespace这样的东西也会很好地工作。

中型博客

我有偏见,因为这对我来说很有效,但这并不意味着我不能推荐写博客!使用像Medium这样的平台,您可以编写项目演练,就像我的onWine Quality Prediction一样。


数据分析咨询请扫描二维码

客服在线
立即咨询