京公网安备 11010802034615号
经营许可证编号:京B2-20210330
这篇文章的目的不是比较角色,好像一个人应该得到更多的钱或不应该得到更多的钱,而是一个指导,允许这两个领域的专业人士根据他们目前的工资进行评估。然而,这是陈词滥调,当要求更高的工资时,记住这两件事仍然很重要:要求无妨,有时,你不会得到你没有要求的东西。请记住,这些是更一般的统计数据,因为你可以根据你想要的具体情况来了解你的工资应该是多少。相反,这些值是供您使用的方向性指南。
数据科学家和数据工程师彼此分享某些技能和经验,然而,也有一些关键的差异,这些差异可能导致不同的工资。话虽如此,让我们从真实数据中跳到下面这两个角色的一些薪酬例子。
由于我已经写了几篇关于数据科学薪酬的文章,我将在这里包括最重要的信息,以及几个不同的例子。
以下是作为数据科学家,你可以看到的一些预期的职位,这些职位的工资也可能会有很大的变化:
入门级数据科学家→数据科学家→高级数据科学家
首席数据科学家-数据科学经理-数据科学总监
除了这些头衔,还有一些资历级别,如I级、II级和III级。
下面,我将按职称和他们各自所需或预期的年数显示工资范围。
请记住,这些角色基于美国平均值(基于PayScale[3]):
我同意这些数字吗?
没有。
如果你读过以前的文章,下面是我将包括不同城市的报告工资,以及不同的技能。
以下是具体的城市和技能:
城市的平均工资本身似乎更符合现实,而与城市相关的具体技能似乎太低了。我相信这是因为当你按照特定的技能进行过滤时,你就会剥离掉所有其他的技能。因此,一个解决办法可能是找到城市的平均工资,然后比较以上技能之间的差异,以获得更现实的工资估计。
我确实认为NLP技能不如Tableau有利可图是很有趣的,然而,我认为NLP可能太具体了,可能更少被误解,而Tableau被广泛理解,大多数数据科学家不认为在他们的简历中添加这一点,因为它更多的是面向数据分析师的--在你意识到你的工资或编辑你的简历时,这一点可能需要记住--长话短说,不要做假设,用你的技能来寻找独特的东西。
我不知道很多使用Java的数据科学家,但我确实认为这些报告中包含的数据有这种技能作为选择是很有趣的,所以也许Java有一个市场,原因我不确定(也许,这是软件工程师向数据科学家的过渡)。
现在,我们对数据科学的工资有了很好的了解,包括不同的因素,如地点和技能,让我们更深入地研究一下更具体的数据工程师工资是什么样子的。
在所有这些薪酬比较中,数据工程师和数据科学家似乎有一个更相似的范围,我们将在下面看到。
以下是作为一名数据工程师,你可以看到的一些预期的职位,这些职位的工资也可能会有很大的变化:
数据工程师→高级数据工程师→数据工程经理
首席软件工程师-数据科学家(是的,专攻数据工程)
除了这些头衔,还有一些资历级别,如I级、II级和III级。
下面,我将按职称和他们各自所需或预期的年数显示工资范围。
请记住,这些角色基于美国平均值(基于PayScale[5]):
我同意这些数字吗?
没有。
我认为每个职位至少应该换一次,因为在职业生涯早期,工资应该是职业生涯中期或有经验的数据工程师的工资,这也取决于你住在哪里--所以让我们深入研究具体的平均位置。
这些城市平均数比总体平均数更有意义。最有趣的是旧金山的不同,然而,仍然是意料之中的,因为那里的生活成本高得令人难以置信。
现在,让我们来看看这些城市的具体技能:
在所有这些工资中,旧金山市的工资在增加一项技能时有所下降--这一声明重申,在查看个性化报告时,你可能想增加所有技能,而不仅仅是一项技能。纽约看到了Scala最大的进步,我个人同意这一点,因为它是一项伟大的技能,很难掌握。
Salary has several characteristics that can either allow it to increase or decrease. We just talked about two factors, years of experience, location (city) and skills. There are other factors to consider as well, including, but not limited to: the interview itself, resume itself, negotiation skills, bonuses, shares, education, and certifications.
概括地说,以下是数据科学家与数据工程师薪酬的一些关键要点:
*美国数据工程师平均薪金92,519美元
*这两个职位的薪酬范围可能最相似
*数据科学家更专注于从现有的Python打包机器学习算法中创建模型,而数据工程师更专注于利用SQL对数据进行ETL/ELT
*有几个因素影响工资,最重要的可能是资历、城市和技能
我希望你觉得我的文章既有趣又有用。如果你同意或不同意这些工资比较,请随时在下面发表评论。为什么或为什么不?你认为在工资方面还有哪些重要的因素需要指出?这些当然可以进一步澄清,但我希望我能够揭示一些数据科学家和数据工程师工资之间的差异。
最后,我可以再问一遍同样的问题,你如何看待偏远职位对薪酬的影响,尤其是当城市是决定薪酬的一个重要因素时?
我也写了一篇类似的文章,讨论机器学习工程师的工资与数据科学家的工资在这里[6],以及数据科学家和数据分析师的工资在这里[7]的区别。这篇文章概述并强调了每一个,各自的工资的类似特点。请记住,对于这两篇文章,这些都不是我的工资,而是由PayScale和其他实际的数据科学家、数据工程师、数据分析师和机器学习工程师报告的。因此,这些文章是围绕真实数据进行的讨论,目的是让您更好地理解是什么使一个角色(一般)根据某些因素增加或减少工资金额。
同样,这个工资数据是从PayScale收集的,如果你想要一个更具体的估计,那么你可以使用salary survey[8]。
[1] Photo byRyan QuintalonUnsplash, (2019)
[2]Copernicoonunsplash的照片,(2020)
[3]PayScale,数据科学家薪酬,(2021)
[4]照片byFotis FotopoulosonUnsplash,(2018)
[5]PayScale,数据工程师薪酬,(2021)
[6]M.Przybyla,《数据科学家vs机器学习工程师工资》,(2021)
[7]M.Przybyla,《数据科学家vs数据分析师工资》,(2021)
[8]PayScale,PayScale薪酬调查,(2021)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16数据是CDA(Certified Data Analyst)数据分析师开展一切工作的核心载体,而数据读取作为数据生命周期的关键环节,是连接原始数 ...
2026-03-16在用户行为分析实践中,很多从业者会陷入一个核心误区:过度关注“当前数据的分析结果”,却忽视了结果的“泛化能力”——即分析 ...
2026-03-13在数字经济时代,用户的每一次点击、浏览、停留、转化,都在传递着真实的需求信号。用户行为分析,本质上是通过收集、整理、挖掘 ...
2026-03-13在金融、零售、互联网等数据密集型行业,量化策略已成为企业挖掘商业价值、提升决策效率、控制经营风险的核心工具。而CDA(Certi ...
2026-03-13在机器学习建模体系中,随机森林作为集成学习的经典算法,凭借高精度、抗过拟合、适配多场景、可解释性强的核心优势,成为分类、 ...
2026-03-12在机器学习建模过程中,“哪些特征对预测结果影响最大?”“如何筛选核心特征、剔除冗余信息?”是从业者最常面临的核心问题。随 ...
2026-03-12