我最近读到一篇文章,将数据科学描述为一个过饱和的领域。文章预测ML工程师将在未来几年取代数据科学家。
根据这篇文章的作者,大多数公司致力于用数据科学解决非常相似的业务问题。因此,数据科学家没有必要提出解决问题的新方法。
作者接着说,在大多数数据驱动的组织中,为了解决问题,只需要基本的数据科学技能。这个角色很容易被机器学习工程师取代--一个拥有数据科学算法基础知识的人,他也拥有部署ML模型的知识。
在过去的一年里,我读过许多类似的文章。
其中一些人表示,数据科学家的角色将被AutoML之类的工具所取代,而另一些人则将数据科学称为“垂死的领域”,很快将被数据工程和ML操作之类的角色所超越。
作为一个与数据行业不同支柱密切合作的人,我想就这个主题提供我的观点,并回答以下问题:
大多数组织中的数据科学工作流程非常相似。许多公司雇佣数据科学家来解决类似的商业问题。大多数建立的模型都不需要你想出新颖的解决方案。
在这些组织中,您将采用的解决数据驱动问题的大多数方法很可能以前已经使用过,您可以从网上可用的大量资源中获得灵感。
此外,AutoML和DataRobot等自动化工具的兴起使预测建模变得更加容易。
我在一些业务用例中使用DataRobot,它是一个很好的工具。它迭代许多值,并为您的模型选择最佳参数,以确保最终得到尽可能高精度的模型。
因此,如果预测模型随着时间的推移变得更加容易,为什么公司仍然需要数据科学家?为什么他们不直接使用自动化工具和ML工程师的组合来管理他们的整个数据科学工作流呢?
答案很简单:
首先,数据科学从来不是关于重新发明轮子或构建高度复杂的算法。
数据科学家的角色是用数据为组织增加价值。在大多数公司中,只有很小一部分涉及到构建ML算法。
其次,总会有自动化工具无法解决的问题。这些工具有一组固定的算法,您可以从中选择,如果您确实发现了一个需要结合使用多种方法来解决的问题,您将需要手动完成。
虽然这种情况并不经常发生,但仍然会发生--作为一个组织,你需要雇佣足够熟练的人来做到这一点。此外,像DataRobot这样的工具不能进行数据预处理,也不能进行建模之前的任何繁重工作。
作为一个为初创企业和大公司创建数据驱动解决方案的人,这种情况与处理Kaggle数据集的情况非常不同。
没有固定的问题。通常,您有一个数据集,然后给您一个业务问题。如何利用客户数据来最大限度地提高公司的销售额取决于您。
这意味着数据科学家需要的不仅仅是技术或建模技能。您将需要将数据与手头的问题连接起来。您需要决定可以优化解决方案的外部数据源。
数据预处理是漫长而艰苦的,不仅因为它需要很强的编程技能,还因为您需要试验不同的变量及其与手头问题的相关性。
您需要将模型精确度与转换率之类的指标联系起来。
模型构建并不总是这个过程的一部分。有时,一个简单的计算可能足以执行像客户排名这样的任务。只有一些问题需要你做出预测。
归根结底,数据科学家为组织提供的价值在于他们将数据应用于现实世界用例的能力。无论是建立细分模型、推荐系统,还是评估客户潜力,除非结果是可解释的,否则对组织没有真正的好处。
只要一个数据科学家能够在数据的帮助下解决问题,并弥合技术和业务技能之间的差距,这个角色就会继续存在。
数据分析咨询请扫描二维码
数据挖掘是现代企业利用数据驱动决策的重要工具。它涉及从大量数据中提取隐藏的、先前未知但潜在有用的信息,依托人工智能、机器 ...
2024-10-23在当前数据驱动的商业环境中,数据分析师的角色变得越来越重要。想要踏入这一领域并取得成功,不仅需要扎实的技术基础,还需要不 ...
2024-10-23数据分析是一个广泛而又精细的领域,它结合了统计学、计算机科学、商业策略以及数据科学等多个学科的知识。这个领域日新月异的发 ...
2024-10-23在现代企业中,数字化管理师扮演着至关重要的角色。他们不仅帮助企业优化资源配置,还推动企业的数字化转型。要成为一名合格的数 ...
2024-10-23大数据专业是一个跨学科的领域,涵盖了数学、统计学、计算机科学与技术等多个学科。随着数据在各个行业中的重要性日益增加,大数 ...
2024-10-23大数据分析师培训教程-2.1 Hadoop入门-Hadoop 1.0 的局限与 Hadoop 2.0(YARN)的革新 Hadoop简介Hadoop 的生态系统HDFS 的原理 ...
2024-10-232024,您是否渴望在数据领域探索更广阔的职业机遇? 数字化时代,数据量级每年都在呈指数级增长。据统计,全球互联网用户每天产 ...
2024-10-21数据科学专业是一门跨学科的综合性学科,涵盖了数学、统计学、计算机科学等多个领域。其核心目标是通过数据的收集、处理和分析来 ...
2024-10-21Python是一种高级解释性编程语言,由Guido van Rossum于1991年创造。凭借其简单易学、代码可读性强和功能强大的特点,Python已经 ...
2024-10-21在当今数据驱动的世界中,选择学习Hadoop已成为许多数据分析师和IT专业人士的必修课。Hadoop不仅是大数据处理领域的核心技术之一 ...
2024-10-21数据开发工程师在当今数据驱动的世界中扮演着至关重要的角色。他们不仅负责数据的采集和处理,还在数据仓库建设、系统开发和数据 ...
2024-10-20在当今快速变化的数字经济时代,数字化转型已经成为企业实现持续增长和竞争优势的关键。数字化转型不仅仅是技术的变革,更是组织 ...
2024-10-19在当今快速发展的科技时代,数字经济已成为全球经济的重要组成部分。选择数字经济专业,不仅能为你打开通往多个行业的大门,还能 ...
2024-10-18学习统计学与大数据分析具有显著的优势,能够帮助你走向高薪岗位。在数字化时代背景下,统计学和大数据分析展现出强大的就业潜力 ...
2024-10-18在当今的数字时代,数据科学与大数据技术专业的就业方向极为广泛,涵盖了多个领域和岗位。随着数据成为企业决策的重要依据,行业 ...
2024-10-18大数据技术与应用领域正在迅速发展,成为现代经济和科技发展的重要驱动力。随着数据量的爆炸式增长,各行各业对大数据专业人才的 ...
2024-10-18在当今数据驱动的商业环境中,数据分析软件已成为企业决策过程中不可或缺的工具。随着数据量的激增和分析需求的复杂化,选择合适 ...
2024-10-18在当今数据驱动的世界中,数据分析已成为许多行业不可或缺的一部分。无论是企业决策、市场营销,还是产品开发,数据分析都能提 ...
2024-10-18数据分析在现代企业中扮演着至关重要的角色,帮助企业在竞争激烈的市场中做出明智的决策。随着数据量的不断增长,企业需要依赖先 ...
2024-10-18CDA(Certified Data Analyst)认证在数据分析领域具有显著的作用,具体包括以下几个方面: 1. 专业技能认可 CDA认证是数据分析 ...
2024-10-17