
我最近读到一篇文章,将数据科学描述为一个过饱和的领域。文章预测ML工程师将在未来几年取代数据科学家。
根据这篇文章的作者,大多数公司致力于用数据科学解决非常相似的业务问题。因此,数据科学家没有必要提出解决问题的新方法。
作者接着说,在大多数数据驱动的组织中,为了解决问题,只需要基本的数据科学技能。这个角色很容易被机器学习工程师取代--一个拥有数据科学算法基础知识的人,他也拥有部署ML模型的知识。
在过去的一年里,我读过许多类似的文章。
其中一些人表示,数据科学家的角色将被AutoML之类的工具所取代,而另一些人则将数据科学称为“垂死的领域”,很快将被数据工程和ML操作之类的角色所超越。
作为一个与数据行业不同支柱密切合作的人,我想就这个主题提供我的观点,并回答以下问题:
大多数组织中的数据科学工作流程非常相似。许多公司雇佣数据科学家来解决类似的商业问题。大多数建立的模型都不需要你想出新颖的解决方案。
在这些组织中,您将采用的解决数据驱动问题的大多数方法很可能以前已经使用过,您可以从网上可用的大量资源中获得灵感。
此外,AutoML和DataRobot等自动化工具的兴起使预测建模变得更加容易。
我在一些业务用例中使用DataRobot,它是一个很好的工具。它迭代许多值,并为您的模型选择最佳参数,以确保最终得到尽可能高精度的模型。
因此,如果预测模型随着时间的推移变得更加容易,为什么公司仍然需要数据科学家?为什么他们不直接使用自动化工具和ML工程师的组合来管理他们的整个数据科学工作流呢?
答案很简单:
首先,数据科学从来不是关于重新发明轮子或构建高度复杂的算法。
数据科学家的角色是用数据为组织增加价值。在大多数公司中,只有很小一部分涉及到构建ML算法。
其次,总会有自动化工具无法解决的问题。这些工具有一组固定的算法,您可以从中选择,如果您确实发现了一个需要结合使用多种方法来解决的问题,您将需要手动完成。
虽然这种情况并不经常发生,但仍然会发生--作为一个组织,你需要雇佣足够熟练的人来做到这一点。此外,像DataRobot这样的工具不能进行数据预处理,也不能进行建模之前的任何繁重工作。
作为一个为初创企业和大公司创建数据驱动解决方案的人,这种情况与处理Kaggle数据集的情况非常不同。
没有固定的问题。通常,您有一个数据集,然后给您一个业务问题。如何利用客户数据来最大限度地提高公司的销售额取决于您。
这意味着数据科学家需要的不仅仅是技术或建模技能。您将需要将数据与手头的问题连接起来。您需要决定可以优化解决方案的外部数据源。
数据预处理是漫长而艰苦的,不仅因为它需要很强的编程技能,还因为您需要试验不同的变量及其与手头问题的相关性。
您需要将模型精确度与转换率之类的指标联系起来。
模型构建并不总是这个过程的一部分。有时,一个简单的计算可能足以执行像客户排名这样的任务。只有一些问题需要你做出预测。
归根结底,数据科学家为组织提供的价值在于他们将数据应用于现实世界用例的能力。无论是建立细分模型、推荐系统,还是评估客户潜力,除非结果是可解释的,否则对组织没有真正的好处。
只要一个数据科学家能够在数据的帮助下解决问题,并弥合技术和业务技能之间的差距,这个角色就会继续存在。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
“纲举目张,执本末从。”若想在数据分析领域有所收获,一套合适的学习教材至关重要。一套优质且契合需求的学习教材无疑是那关键 ...
2025-06-092025 年,数据如同数字时代的 DNA,编码着人类社会的未来图景,驱动着商业时代的运转。从全球互联网用户每天产生的2.5亿TB数据, ...
2025-05-27CDA数据分析师证书考试体系(更新于2025年05月22日)
2025-05-26解码数据基因:从数字敏感度到逻辑思维 每当看到超市货架上商品的排列变化,你是否会联想到背后的销售数据波动?三年前在零售行 ...
2025-05-23在本文中,我们将探讨 AI 为何能够加速数据分析、如何在每个步骤中实现数据分析自动化以及使用哪些工具。 数据分析中的AI是什么 ...
2025-05-20当数据遇见人生:我的第一个分析项目 记得三年前接手第一个数据分析项目时,我面对Excel里密密麻麻的销售数据手足无措。那些跳动 ...
2025-05-20在数字化运营的时代,企业每天都在产生海量数据:用户点击行为、商品销售记录、广告投放反馈…… 这些数据就像散落的拼图,而相 ...
2025-05-19在当今数字化营销时代,小红书作为国内领先的社交电商平台,其销售数据蕴含着巨大的商业价值。通过对小红书销售数据的深入分析, ...
2025-05-16Excel作为最常用的数据分析工具,有没有什么工具可以帮助我们快速地使用excel表格,只要轻松几步甚至输入几项指令就能搞定呢? ...
2025-05-15数据,如同无形的燃料,驱动着现代社会的运转。从全球互联网用户每天产生的2.5亿TB数据,到制造业的传感器、金融交易 ...
2025-05-15大数据是什么_数据分析师培训 其实,现在的大数据指的并不仅仅是海量数据,更准确而言是对大数据分析的方法。传统的数 ...
2025-05-14CDA持证人简介: 万木,CDA L1持证人,某电商中厂BI工程师 ,5年数据经验1年BI内训师,高级数据分析师,拥有丰富的行业经验。 ...
2025-05-13CDA持证人简介: 王明月 ,CDA 数据分析师二级持证人,2年数据产品工作经验,管理学博士在读。 学习入口:https://edu.cda.cn/g ...
2025-05-12CDA持证人简介: 杨贞玺 ,CDA一级持证人,郑州大学情报学硕士研究生,某上市公司数据分析师。 学习入口:https://edu.cda.cn/g ...
2025-05-09CDA持证人简介 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度、美团、阿里等 ...
2025-05-07相信很多做数据分析的小伙伴,都接到过一些高阶的数据分析需求,实现的过程需要用到一些数据获取,数据清洗转换,建模方法等,这 ...
2025-05-06以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda.cn/g ...
2025-04-30CDA持证人简介: 邱立峰 CDA 数据分析师二级持证人,数字化转型专家,数据治理专家,高级数据分析师,拥有丰富的行业经验。 ...
2025-04-29CDA持证人简介: 程靖 CDA会员大咖,畅销书《小白学产品》作者,13年顶级互联网公司产品经理相关经验,曾在百度,美团,阿里等 ...
2025-04-28CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-27