登录
首页大数据时代给有抱负的数据科学家的建议--回答你最常见的问题
给有抱负的数据科学家的建议--回答你最常见的问题
2022-03-14
收藏

罗曼·奥拉克,数据科学家

我收到许多信息,向有抱负的数据科学家寻求建议。我不是职业建议方面的专家,所以对我写的一切都持怀疑态度。

我根据我对这个领域的观察和我多年来积累的经验给出建议。这是我,建议年轻的我,因为我有类似的问题,在我的职业生涯开始。

学习和实践数据科学的最佳方式是什么?

我的建议是从实际项目开始,然后慢慢地进行理论研究。Kaggle笔记本是学习实际部分的好方法。

在Reddit社区或交叉验证社区中提问。

当您对自己的工具和实践知识感到满意时,我建议您自己为某些问题构造数据集(例如,您可以刮取数据),并对其应用ML算法。ML中最难的是数据集的构造。你甚至可以用它建立一个公司。

Kaggle是学习实际部分的一个很好的方法。

学习机器学习的好资源是什么?

我建议您从免费资源开始,因为有许多免费资源可用于编程、机器学习和数据科学:

  • 2020年每个数据科学家都应该阅读的7本免费电子书
  • 2020年每个数据科学家都应该阅读的7本免费编程书籍
  • 来自常春藤盟校的7大免费人工智能课程

我个人很喜欢吴恩达的Machine LearningCoursera课程。这门课程开始很容易,然后随着它的进行逐渐变得困难。它的优点在于它专注于机器学习的基础知识。

我建议你至少听前几堂课。如果你不明白所有的事情,也不要担心,因为你可以在以后重温它。我也建议你不要只专注于一个课程。我们学得都不一样,没关系。

我们学得都不一样,没关系。

我几乎没有任何技术背景。你认为最好的学习方法是什么?

不要一个人学习!寻找并加入能帮助你学习和成长的在线社区。我在以下文章中写过关于数据科学社区的文章:

  • 在家工作时的数据科学

您可以开始在Excel中练习机器学习。尝试在Excel中实现线性回归。这是一个很好的第一个挑战,它会让你有动力。

开始在Excel中练习机器学习

我应该学Python还是R?

让我们对房间里的大象讲话。如果您刚刚起步,我建议您学习Python。主要原因有:

  • 丰富的数据科学生态系统,后端…你说什么,Python都有。
  • 这种语言的流行势头仍在增强。

使用Python,您可以进行分析,从头开发模型,然后在生产中运行它。虽然我确信R中的模型也在生产中运行,但我还没有听说过(如果您的经验不同,请在评论中告诉我)。

别误会,如果你知道R,那完全没问题。数据科学团队通常使用这两种语言,一些人喜欢R,另一些人喜欢Python。

最后,这并不重要,因为有些模型必须用编译语言(Java,Go)重新实现,以便在生产中做出更快的预测。

Python使您能够进行分析、从头开发模型并在生产中运行它。

我应该学习SQL吗?

这是个很棒的问题。答案是肯定的--用大写字母。

无论您是否使用SQL数据库,您都应该了解关系数据库中的主要概念,如joinsgroup by、window functions、lag、lead等。即使在使用pandas、R或其他工具时,这些概念也是必不可少的。

如果您感兴趣,我还写了几篇关于SQL的文章:

  • 编写SQL查询时的5个错误
  • 不要在SQL中重复这5个错误

答案是肯定的--用大写字母。

我应该多上数学课吗?

你知道的数学越多,从长远来看对你越好。了解数学将使您能够理解黑匣子机器学习模型的幕后发生了什么。从理论到实践的知识转移也更容易。

有了数学,你就会明白黑匣子模型的幕后发生了什么。

数学和统计学在数据科学中重要吗?

当你需要改进模型时,数学就变得至关重要。您需要数学来理解不同类型的模型、发行版等之间的差异。

资深机器学习工程师只需看优化函数就能说出一个模型的主要性质。

当你试图改进模型时,数学变得至关重要。

我应该上哪些课才能更好地为数据科学角色做好准备?

我的建议是提前考虑。每个领域都需要一名数据科学家,或者将来也会需要。问问自己,完成学业后,你希望在哪家公司实习?如果你已经听过一些相关的课程,就更容易获得生物信息学的实习机会。

提前想想。

我需要博士学位吗。从事数据科学工作?

你不需要博士学位。从事数据科学工作--意味着对现实世界的数据进行分析,并应用机器学习模型。

如果你的目标是做研究和开发新的机器学习算法(例如,在Deep Mind工作),那么你应该攻读博士学位。

你不需要博士学位。从事数据科学工作,但是...

如何获得你在数据科学领域的第一份工作?

参加LocalMeetups。公司在那里寻找新雇员。也许从数据质量评估部门开始--大公司有这些。在线社区也能有所帮助。

参加当地的聚会。

我怎么知道哪份工作有最好的导师?

最近,我写道,“当你有多个工作机会时,接受一个有更好导师的工作机会。”

你怎么知道哪家有最好的导师?在面试过程中尽可能多地了解团队成员、经理、他们的背景等信息。查看他们的LinkedIn。他们在Quora、StackOverflow、Medium上写吗?做你的研究。


数据分析咨询请扫描二维码

客服在线
立即咨询