登录
首页大数据时代数据科学家是做什么的?
数据科学家是做什么的?
2022-02-21
收藏

你真的无法避免,是吗?你看哪里就提到哪里。你的LinkedIn订阅、就业市场、新闻订阅、试图吸引你注意力的教育项目(还有你的入学费)。但数据科学到底是什么?它通常被描述得很模糊,留下了许多不尽如人意的地方。本指南将试图避免所有这些,并为您提供关于“什么是数据科学?”的最佳、最直接和明确的答案。以及“数据科学家是做什么的?”。

那么,数据科学家是做什么的呢?为了回答这个问题,我们将带领您了解数据科学工作的各个方面。

数据科学家的角色和职责

数据科学的作用是利用每个公司现在收集的深不可测的大量数据,并将其转化为可理解和有用的信息。将数据转换为信息是通过使用诸如机器学习(ML)、人工智能(AI)和统计分析等技术来完成的。所有这些都是为了解决现实世界的问题。现实世界通常被转化为业务问题。这意味着公司使用数据科学来做出更合理的商业决策,并获得更多利润。

既然我们已经讨论了数据科学家的角色,现在是时候问一下这在实践中意味着什么了。数据科学家是做什么的?一个直接的问题应该得到直接的回答。

数据科学家:

  1. 识别业务问题
  2. 收集数据
  3. 通过操作和清理数据来准备分析数据
  4. 存储数据
  5. 分析数据以发现趋势和模式
  6. 构建、训练和验证模型
  7. 提出见解

数据科学职称

数据科学中最通用的职位头衔是数据科学家,它涵盖了数据科学领域中使用的所有技能。作为一名数据科学家包括了上述所有的责任。然而,如果你在数据科学领域工作,这并不是你能拥有的唯一职位。

还有许多其他职位头衔取决于资历、公司组织、规模等。最重要的是,这些职位头衔取决于他们所关注的数据科学领域。你可以把它看作是数据科学家是数据科学的原始汤,所有其他的职位头衔都源于它。

一般来说,数据科学领域的职位可以分为以下两类:

  • 数据提供者
  • 数据用户

在我们的博客帖子中有关于每一个数据科学工作的非常详细的信息,我们将在这里提到。使用该职位可以找到每个职位所需的详细职务描述和技能。

数据提供者

当我们谈论数据提供者时,我们谈论的是专注于原始数据、数据基础设施、数据加载和数据库的工作。

例如,这一类别中的数据科学职位有:数据建模师、数据工程师、数据库管理员、数据架构师和软件工程师。以这样或那样的方式,它们都确保数据科学中的另一类工作(数据用户)可以不间断地访问数据,这为数据用户建立基础奠定了基础。

当然,所有这些数据提供者作业在它们之间有不同的目的。

数据建模

例如,数据建模师创建概念、逻辑和物理数据库模型,并参与数据库实现。

数据工程师

数据工程师更关心的是数据基础设施及其开发和维护,包括数据仓库和提取、转换和加载数据(ETL/ELT)。

查看我们关于数据工程师vs数据科学家的帖子,该帖子可以解释数据科学家和数据工程师的共同点和不同点。

数据库管理员

根据数据基础结构,数据库管理员确保数据和数据库的完整性和安全性。这包括授予和撤销对数据的访问权、备份数据库、还原数据等。

软件工程师

在上述职位所提供的数据基础设施之上,坐着软件工程师。他们设计、开发、测试和维护作为接口数据的软件,用户将使用这些接口数据来充分利用底层数据和数据基础设施。

数据架构

数据架构师提供全局并协调所有这些数据提供者。他们的工作是理解公司的流程,这样他们就可以计划、实施和改进公司数据处理基础设施的体系结构。这意味着为数据如何在不同的入口点进入公司提供解决方案。数据以哪种格式输入,使用哪种软件处理(如果有的话),以及如何将数据转换并加载到数据库或数据仓库中。如何被公司使用直到点数据成为公司的输出。

数据用户

数据用户利用现有数据和数据基础设施向各类股东提供信息。它们是数据提供者和决策者之间相当“工程”工作的纽带,决策者通常不太在技术方面。

数据科学中的数据用户,除了数据科学家之外,还包括数据分析师、统计学家、BI开发人员、业务分析师、数量分析师、营销科学家、机器学习工程师、研究科学家等。同样,他们在公司中都有不同的目的。

数据分析师

例如,数据分析员侧重于报告、定期和特别分析。他们使用数据并将其汇总成报告格式。这使得不太懂技术的用户有可能使用这些数据并了解公司业务的各个方面。数据分析员主要使用历史数据。

统计学家

统计学家在分析数据的方式上也与数据分析家相似。然而,他们更关心的是预测未来,而不是解释过去。他们用数据来观察将要发生的事情,而不是已经发生的事情。为了做到这一点,他们将统计方法应用于数据,如假设检验和概率。那样的话,统计学家也类似于数据科学家。不同的是,与数据科学家不同,他们不建立模型,只专注于数据科学的统计部分。

BI开发人员

BI开发人员是在BI工具中开发(设计、构建和维护)仪表板的人员,其目的是实现数据可视化和报告。他们做报告的方式类似于数据分析师。然而,他们也有一些工程技能,他们使用这些技能来ETL数据和构建用户界面,就像数据工程师和软件工程师分别做的那样。

业务分析师

业务分析师专注于报告,就像数据分析师一样。然而,他们通常专注于内部报告,以发现公司业务流程中的弱点并加以改进,数据分析师并不总是这样。

量化分析师

定量分析师通常是专注于金融数据的数据科学家。他们将分析它并建立各种金融市场的模型,如贷款、股票、债券、外汇等。他们的分析将用于决定交易策略、可行的投资和风险管理。

营销科学家

市场营销科学家同样是数据科学家,他们只处理一种类型的数据。在这种情况下,是营销数据。像任何数据科学家一样,他们会分析这些数据,并试图找到模式和趋势来解释和预测客户行为,这有助于解决营销和销售问题。

机器学习科学家

机器学习科学家是数据科学家的某种延伸。当数据科学家更关心建立模型的理论部分时,数据工程师将这些模型付诸实践。他们获取原型模型并将其部署到生产中。这涉及到工程人工智能软件和算法,这些软件和算法将使机器学习模型在实践中发挥作用。

研究科学家

虽然机器学习工程师是这类数据科学家中的实践者,但研究科学家是理论家。研究科学家的工作是理解计算原理和由此产生的问题。为了解决这些问题,他们改进或创建了全新的算法和编程语言。

数据科学职业道路

在下面的图片中,有一个例子说明了你的数据科学家职业道路可能是什么样子的。这并不意味着这是一个单向的旅程(根本不必是一个旅程!)或者这些职位头衔不能互换,不能以不同的方式在之间移动。这只是一个概述,看一看,然后我们会跟着做一些解释。

教育作为起点

数据科学发现自己处于统计学、数学和计算机科学的十字路口。还有其他一些学科。因此,至少在这些领域接受教育是一个很好的起点。

然而,我们不能写出适用于每个应聘者和招聘广告的指南。一般的经验法则是:至少获得学士学位,才能在数据科学就业市场上有一个良好的起点。然后结合工作经验。两者的良好平衡总是一个你不会出错的食谱。当然,接受更多的教育和更多的经验总是会让你处于更好的位置;这并不奇怪。让我们来看看学历/学位要求是什么:

  1. 学士学位/硕士学位
  2. 博士。
  3. 训练营

学士学位/硕士学位

如果你想在数据科学领域建立一个职业生涯,至少拥有学士学位是个好主意。拥有学士学位或硕士学位对获得数据科学方面的任何工作都有好处,大多数招聘广告都要求这种教育水平。你的学位应该是相关的量化领域,如统计学、数学、计算机科学、工程、IT、经济学、编程等。当然,这取决于职位头衔和资历水平。

此外,根据工作的不同,你可能会从一些不同领域的学位中获得好处。也许人文学科,如哲学、社会学、心理学。它们可能很有用(有时甚至是必需的!)如果你想成为一名试图理解和预测人类行为的营销科学家。研究科学家有时可以研究与伦理和人类行为有很深联系的计算原理。

根据职位描述和资历,如果你有金融、商业或类似的学位,这也是有益的。也许你在处理财务数据,而你是高层,所以除了你的技术技能之外,拥有一些领导力、商业常识和教育也变得很重要。

虽然学士学位通常是招聘广告中要求的最低教育水平,但有时并不是唯一的教育水平。

博士学位

有博士学位。不会影响你得到上面任何工作的机会。多受教育总是更好。

然而,有时这一级别不仅很好,而是必需的。例如,获得博士学位将是一个好主意。如果你想做一个ML工程师或任何其他数学密集型的工作。

此外,研究科学家需要在计算机科学理论、原理和研究方法方面有很强的能力。这就是为什么博士。是这个职位经常需要的。

训练营

虽然正规教育在招聘广告中经常被要求,但这并不意味着它总是必要的。如果你在数据科学的某些方面经验丰富,但没有在这一领域接受过正规教育,这并不意味着你不能从事数据科学家的工作。一般来说,职位越高,你的教育就越不重要。重要的是你在以前的工作中做了什么,你是怎么做的,你能给新的工作带来什么技能。

这里有一个第22条军规。你需要一份工作来获得经验和提高技能。如果你没有经验,没有技术技能,你就找不到工作。幸运的是,有一个解决办法:新兵训练营。

它们是获得数据科学适当技能的良好起点。他们不需要技术学士学位或硕士学位。这是伟大的任何人谁没有受过正规教育,并想开始在数据科学的职业生涯。它们也适用于通过实践漫步进入数据科学的人。这样,他们就可以对他们已经在实践中做的事情有一个更结构化和理论上的背景,或者提高他们已经存在的技能。

数据科学家工作经验

说到工作经验,开始获得工作经验总是最难的。一旦你开始工作并在工作中学习,跳槽和拓宽专业领域就变得更容易了。筑牢基础很重要。当开始从事数据科学时,人们通常是从数据分析师开始的。

从那时起,他们可以选择进入我们前面讨论过的两个方向:作为数据提供者工作或作为数据用户工作。上图中重要的一点是,当你从左到右时,职位的资历会上升,你的薪水也会上升。我们一会儿再谈工资问题。让我们先来看看一两个例子,看看你的职业生涯会是什么样子。

假设你从数据分析师开始。经过几年的数据工作,并找到了自己的数据库解决方案,您理解了数据库原理,因此决定成为一名数据建模师或数据库管理员。在其中一个职位上工作可以获得更多的经验,并且可以参与几个关于数据基础设施的项目。然后你得到提升,成为一个数据架构师,例如。

或者你从统计学家开始。在一家公司呆了几年后,你决定是时候改变了。但你真的很喜欢你所在的公司。而且你真的很喜欢你去年参与的几个营销项目。你搬到一个营销部门,只处理营销数据,然后成为一名营销科学家。话说回来,是时候改变了;你对机器学习产生了兴趣,成为了一名数据科学家。几年后,你想回到学校获得博士学位。你辞掉了这份工作,全身心地投入到获得博士学位的工作中。这一点,结合您丰富的工作经验,使您意识到您希望以一种不同的,也许是理论的方式为数据科学做出贡献。然后你就成了研究科学家。

这些只是你职业生涯的例子。任何与实际的人和他们的职业相似都纯属巧合。你的职业生涯将取决于你的背景、你的能力、你的兴趣、你在你(或其他)公司的机会、公司的规模、组织、灵活性,是的,还有一点点运气。

从长远来看,你选择的任何方式都能让你受益。请记住,所有这些工作都是数据科学的一部分,所以只有当您想要在数据科学领域中做一些新的事情时,在数据科学的一个领域中拥有更多的经验才是有益的。

当然,要获得经验,你首先需要一份工作。为了得到一份工作,你必须经历通常繁琐的求职面试过程。为了让这种经历尽可能地无痛,你需要做好准备。虽然没有什么比面试经验更好的了,但通过自己的codingandnoncoding面试问题会让你有一个很好的起跑点。

你需要的数据科学技术技能

在数据科学中,以下技能是必须具备的:

  • SQL、R、Python、Java、C族等语言编码
  • 使用数据,包括收集、清理和分析数据
  • 数据库设计以了解如何获取和存储数据
  • 统计分析从数据中获得洞察力
  • 数学用于数据分析和度量计算
  • 建模用于设计和构建模型
  • ML&AI用于部署模型

查看我们关于最受欢迎的数据科学技能的帖子,了解作为一名数据科学家,您必须具备哪些数据科学技术技能和业务技能。

数据科学薪酬

在选择职业时,除了你的兴趣和环境之外,薪水也是一个因素。

Jobted援引美国劳工统计局(BLS)的数据称,美国的平均年薪约为53.5K。

那么数据科学的工作与此相比如何呢?例如,Glassdoor datashows数据分析师的平均年薪为7000万美元。即使是这份(平均)收入最低的数据科学工作,你的收入也会比美国平均水平高出15k美元以上。这多了30%!

作为数据科学领域收入最高的工作之一,数据科学家的平均收入可以达到13.9万美元,比平均水平高出1.5倍以上。即使是报告的最低工资也是美国平均工资的两倍,而工资可以高达17.1万美元。这甚至不是数据科学中收入最高的工作。

教育、知识和技能确实会有回报,如果你想知道你应该投资于职业发展或改变的话。以下是以美元计算的工作职位和平均工资概述。

Data analyst $70k
Database administrator $84k
Data modeler $94k
Software engineer $108k
Data engineer $113k
Data architect $119k
Statistician $89k
Business intelligence (BI) developer $92k
Marketing scientist $94k
Business analyst $77k
Quantitative analyst $112k
Data scientist $139k
Research scientist $142k
Machine learning engineer $189k

根据你工作的公司,你可以期望这些基本工资通过不同的福利来增加,如现金和股票奖金、健康和人寿保险等。

您可以在我们的一篇博客文章中找到关于数据科学薪酬的更详细信息--数据科学家赚多少钱?。

数据科学工作时间

通常,高需求和获得相当丰厚的报酬是有代价的。不,在数据科学中并不都是乐观的。虽然数据科学家通常每周工作40小时,但偶尔需要投入很长时间。同样,这取决于公司、组织、行业和其他众多因素。但最常见的情况是,它与工作描述和它的周期性有关,这意味着你将在完全放松和轻松的时期和每周必须投入50-60个工作小时的高峰期之间取得平衡。

这是因为数据科学任务通常涉及项目,这意味着在严格的最后期限内解决问题。随着最后期限的临近,工作量通常会增加,这时数据科学家不得不投入额外的时间。

是什么造就了一个伟大的数据科学家?

拥有相关的教育和技术技能,当然是成为数据科学家的先决条件。要完成第一步,请遵循我们在讨论如何从头开始成为一名数据科学家时提供的有用建议。但这会让你成为一个伟大的数据科学家吗?不一定。

数据科学的重点是解决现实生活中的问题。你可以拥有世界上所有的技术技能,但如果你不能利用那些辉煌的技能来想出一个解决方案,那又有什么意义呢?或者你想出了一个解决方案,但没有人理解它并使用它。你真的解决问题了吗?不,你没有。

技术技能是用来解决问题的,磨练它们的最好方法之一是创建一个你自己的数据分析项目。然而,你也需要软技能。想出一个解决方案有点夹在数据科学家工作的另外两个重要阶段之间。

  1. 理解问题
  2. 提出解决方案(通过技术技能)
  3. 提出解决方案

要成为一名伟大的数据科学家,您需要:

  1. 幼稚
  2. 沟通良好
  3. 善于团队合作
  4. 使用跨部分功能感觉良好

幼稚

我们不是在说成为一个被宠坏的孩子。孩子气意味着好奇,问问题,想学,爱玩。

你需要有好奇心,接受自己并不是什么都懂,并且愿意学习。要做到这一点,你必须像孩子一样:问问题,直到他们得到他们满意的答案。你需要成为“为什么”的人。只有这样,你才能理解业务问题,不同的人,部门和客户的需求。一旦你理解了它们,使用你的技术技能就变成了,嗯,技术性。

当你想出一个解决方案时,你需要对如何展示你可能非常复杂的解决方案表现得有趣和富有想象力,以便其他人能够理解并使用它。

沟通

沟通是第一技能的自然延伸。你需要有效地沟通,提出正确的问题,以可理解的方式提出你的想法和解决方案。当人们觉得你愿意接受建议,你在倾听他们,并尊重他们时,他们会更多地参与项目。他们愿意更详细地解释他们的(业务)需求和问题,使你更容易正确地理解对你的要求。

当然,如果您不能解释数据科学解决方案是如何工作的,它如何使用户受益,以及他们如何使用它,那么就没有必要提出一个出色的数据科学解决方案。因此,当你提出你的解决方案时,沟通是必要的。

团队合作

不管幸运与否,你将和真正的人一起工作,试图解决他们真正的问题。你不会一个人在你的部门工作。你不会只和你部门的人一起工作。你将与来自各行各业的不同人士一起工作,他们拥有不同的技术技能、专业知识和经验。要成为一个成功的数据科学家,你必须了解人们,对他们有耐心,灵活,适应不同的情况和方法。

创造一个良好的工作氛围对公司、你的团队和你自己都有好处。可靠、负责任、乐于帮助同事是我们一直感激的事情。

跨段性

在(不同的)团队中与人一起工作意味着你将与不同的水平和专业领域一起工作。这是你学习的机会。这时跨部门性就出现了。

一个在数据科学的严格界限之外一无所知的数据科学家不可能是一个伟大的数据科学家。跨部门将使您更快地理解和解决问题。您将更清楚地呈现解决方案。了解商业、营销、报告、法律或你所工作的行业的任何其他方面,很容易让你成为一个非常理想的雇主。能够在技术部门和非技术部门之间架起桥梁的专家是罕见的,非常有价值的花朵。

结论

数据科学是当今就业市场上最热门的领域之一。对数据科学家的需求很高,但竞争也很激烈。

这意味着成为一名数据科学家并不容易。不过,这也不是不可能。这本指南是一个东西,应该使它更容易决定数据科学是否适合你。总而言之,以下是在数据科学领域获得一份工作并取得成功的步骤:

  1. 获得计算机科学或其他定量领域的教育。
  2. 学习您的技术技能,如编程、数据分析、数据库设计和模型构建。
  3. 仔细准备工作面试,这意味着回答尽可能多的技术和非技术问题,研究公司和你申请的职位。
  4. 提高你的软技能。


数据分析咨询请扫描二维码

客服在线
立即咨询