初学者必看丨如何成为一名数据科学家 -CDA数据分析师官网

热线电话：13121318867

初学者必看丨如何成为一名数据科学家

2017-12-22

初学者必看丨如何成为一名数据科学家

想从事数据科学领域的初学者总是很困惑：应该学习哪种编程语言？专业重要吗？需要掌握哪些工具和技能？在这篇文章中，你的这些问题都能得到解答。

几星期前，我发布了我的第二篇Kaggle Kernel( Kernel: Kaggle 中用于探索概念、展示技术或分享解决方案的短脚本)。我对Kaggle最近发布的“机器学习和数据科学现状”调查很感兴趣，并认为我可以从中得出一些有趣的见解。我以为大多数写Kernel的人都已经是数据科学家了，比起如何入门，他们应该对其他的内容更感兴趣。

令我惊讶的是，我赢得了每周一次的Kernel奖，我的这篇Kernel最终获得了超过预期的关注度。

在这里我把这篇分享给大家，探究如何成为一名数据科学家。

一、编程语言

据我所知，数据科学领域有两种语言是最常用的，即Python和R语言。我个人比较喜欢R语言，但是好奇在实际情况中是什么样的。

我根据受访者的职位，比较选择Python或R语言作为主要编程语言的人数。事实证明，除了统计学和运筹学之外，其他职位中使用Python的人数更多。然而这两个领域，特别是运筹学由于样本量太小，以至于结果的参考价值并不高。

二、专业和职位

我想知道哪些专业倾向选择哪些职位，因此我创建了比较大学专业和所选职位的图表。

当然，计算机科学专业的人群会成为计算机科学家，程序员和软件工程师。数学专业的人群会选择预测建模，数据科学和统计学职位，物理专业则倾向于进入研究领域。

图表中一个有趣的信息是，每个职位都有至少一名非此专业的人士。这表明，只要你有理想，所学专业不是限制做你想做的事情的理由。

三、学习资源

用来学习数据科学的在线资源特别丰富。我很好奇对于调查的受访者来说哪些在线资源是最有用的。

事实证明，人们认为创建项目，参加课程，参加Kaggle挑战是学习和了解数据科学最有用的方法。我很喜欢从事数据科学的项目，并在完成项目的过程中一步步成长为一名数据科学家。

四、重要的工作技能

调查的另一个问题是询问受访者，他们认为在工作中最有用的技能是什么。

掌握Python和统计知识被认为是最有用的工作技能。这方面R语言略微落后于Python，这反映了第一张图的情况。有趣的是，MOOC(大型开放式网络课程)在实用性方面得分最低。然而上一张图中，人们认为在线课程是学习数据科学最有用的资源之一。这也让我感觉不是跟确定，是不是受访者认为在找工作时，MOOC不应该被用作认证。

五、实际运用的工具

受访者也被问到，他们认为哪些技术在日常工作中最有用。在以下图表中，我分析了所有受访者的情况，以及具体的职位情况。