京公网安备 11010802034615号
经营许可证编号:京B2-20210330
我只想说,你是选择数据科学还是数据工程,最终应该取决于你的兴趣和你的激情所在。然而,如果你坐在篱笆上,不确定该选择哪一个,因为他们是同样感兴趣的,那么继续阅读!
数据科学一时成为热门话题,但一个新的丛林之王已经到来--数据工程师。在本文中,我将与您分享几个原因,为什么您可能希望考虑使用数据工程而不是数据科学。
请注意,这是一篇固执己见的文章,并从中获取您想要的内容。话虽如此,我希望你喜欢!
我们都听过“垃圾进,垃圾出”这句话,但直到现在,公司才开始真正理解这句话的含义。机器学习和深度学习可能是强大的,但只有在非常特殊的情况下。除了需要大量的数据和ML和DL的实际使用之外,公司还需要自下而上地满足数据需求层次结构。
就像我们在社交需求(即关系需求)之前有物理需求(即食物和水)一样,公司需要满足几个通常属于数据工程伞的需求。请注意数据科学,特别是机器学习和深度学习,是最重要的东西。
简单地说,没有数据工程就没有数据科学。数据工程是一个成功的数据驱动公司的基础。
正如我之前所说的,公司正在意识到对数据工程师的需求。因此,目前对数据工程师的需求越来越大,这是有证据的。
根据ToIntegrated Query的数据科学面试报告,2019年至2020年,数据科学面试数量仅增长了10%,而同期数据工程面试数量增长了40%!
此外,Mihail Eric对Y-Combinator的职位发布进行了一项分析,发现的数据工程角色比的数据科学家角色多70%。
你可能会想,“当然增长要高得多,但就绝对数字而言呢?”
我冒昧地从Indeuts、Monster和SimplyHired上搜索了所有数据科学家和数据工程师的职位,发现这两个职位列表的数量都差不多!
总共有16577份数据科学家工作清单和16262份数据工程师工作清单。
在更成熟的公司中,工作通常是分开的,这样数据科学家可以专注于数据科学工作,而数据工程师可以专注于数据工程工作。
但大多数公司通常不是这样。我想说,大多数公司实际上都要求他们的数据科学家了解一些数据工程技能。
许多数据科学家最终需要数据工程技能。
作为一名数据科学家,了解数据工程技能也是非常有益的,我将举一个例子:如果您是一名不懂SQL的业务分析师,那么每次想要收集见解时,您都必须要求数据分析师查询信息,这在您的工作流程中造成了瓶颈。类似地,如果您是一名数据科学家,没有数据工程师的基本知识,那么您肯定会不得不依赖其他人来修复ETL管道或清理数据,而不是自己完成。
在我看来,作为一名数据工程师学习数据科学比作为一名数据科学家学习数据工程技能容易得多。为什么?数据科学有更多的可用资源,有许多工具和库被构建来使数据科学变得更容易。
因此,如果你正在开始你的职业生涯,我个人认为花时间学习数据工程比数据科学更值得,因为你有更多的时间可以投入。当你从事一份全职工作,进入职业生涯几年后,你可能会发现你没有能力或精力在学习上投入那么多时间。所以从这个角度来看,我认为最好先学比较难的领域。
我不只是在谈论工作机会,而是通过新的工具和方法来创新和使数据工程变得更容易的机会。
当数据科学最初被大肆宣传时,人们发现了学习数据科学的几个障碍,比如数据建模和模型部署。后来出现了像PyCaret和Gradio这样的公司来解决这些问题。
目前,我们正处于数据工程的初始阶段,我预见到许多使数据工程变得更容易的机会。
虽然这是一篇固执己见的文章,但我希望这能让您了解为什么想成为一名数据工程师。我想重申,你是选择数据科学还是数据工程,最终应该取决于你的兴趣和你的激情所在。我一如既往地祝你在你的努力中好运!
不知道接下来要读什么?我为您挑选了另一篇文章:
4个你不应该成为数据科学家的理由
为什么数据科学工作不适合你
和另一个!
想成为一名数据科学家吗?不要从机器学习开始。
有抱负的数据科学家最大的误解
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12在数字化转型深度渗透的今天,企业管理已从“经验驱动”全面转向“数据驱动”,数据思维成为企业高质量发展的核心竞争力,而CDA ...
2026-03-12在数字经济飞速发展的今天,数据分析已从“辅助工具”升级为“核心竞争力”,渗透到商业、科技、民生、金融等各个领域。无论是全 ...
2026-03-11上市公司财务报表是反映企业经营状况、盈利能力、偿债能力的核心数据载体,是投资者决策、研究者分析、从业者复盘的重要依据。16 ...
2026-03-11数字化浪潮下,数据已成为企业生存发展的核心资产,而数据思维,正是CDA(Certified Data Analyst)数据分析师解锁数据价值、赋 ...
2026-03-11线性回归是数据分析中最常用的预测与关联分析方法,广泛应用于销售额预测、风险评估、趋势分析等场景(如前文销售额预测中的多元 ...
2026-03-10在SQL Server安装与配置的实操中,“服务名无效”是最令初学者头疼的高频问题之一。无论是在命令行执行net start启动服务、通过S ...
2026-03-10在数据驱动业务的当下,CDA(Certified Data Analyst)数据分析师的核心价值,不仅在于解读数据,更在于搭建一套科学、可落地的 ...
2026-03-10在企业经营决策中,销售额预测是核心环节之一——无论是库存备货、营销预算制定、产能规划,还是战略布局,都需要基于精准的销售 ...
2026-03-09金融数据分析的核心价值,是通过挖掘数据规律、识别风险、捕捉机会,为投资决策、风险控制、业务优化提供精准支撑——而这一切的 ...
2026-03-09在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心工作,是通过数据解读业务、支撑决策,而指标与指标体系 ...
2026-03-09在数据处理的全流程中,数据呈现与数据分析是两个紧密关联却截然不同的核心环节。无论是科研数据整理、企业业务复盘,还是日常数 ...
2026-03-06在数据分析、数据预处理场景中,dat文件是一种常见的二进制或文本格式数据文件,广泛应用于科研数据、工程数据、传感器数据等领 ...
2026-03-06在数据驱动决策的时代,CDA(Certified Data Analyst)数据分析师的核心价值,早已超越单纯的数据清洗与统计分析,而是通过数据 ...
2026-03-06在教学管理、培训数据统计、课程体系搭建等场景中,经常需要对课时数据进行排序并实现累加计算——比如,按课程章节排序,累加各 ...
2026-03-05在数据分析场景中,环比是衡量数据短期波动的核心指标——它通过对比“当前周期与上一个相邻周期”的数据,直观反映指标的月度、 ...
2026-03-05数据治理是数字化时代企业实现数据价值最大化的核心前提,而CDA(Certified Data Analyst)数据分析师作为数据全生命周期的核心 ...
2026-03-05在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04