京公网安备 11010802034615号
经营许可证编号:京B2-20210330
这篇文章的目的不是比较角色,好像一个人应该得到更多的钱或不应该得到更多的钱,而是一个指导,允许这两个领域的专业人士根据他们目前的工资进行评估。然而,这是陈词滥调,当要求更高的工资时,记住这两件事仍然很重要:要求无妨,有时,你不会得到你没有要求的东西。请记住,这些是更一般的统计数据,因为你可以根据你想要的具体情况来了解你的工资应该是多少。相反,这些值是供您使用的方向性指南。
数据科学家和数据工程师彼此分享某些技能和经验,然而,也有一些关键的差异,这些差异可能导致不同的工资。话虽如此,让我们从真实数据中跳到下面这两个角色的一些薪酬例子。
由于我已经写了几篇关于数据科学薪酬的文章,我将在这里包括最重要的信息,以及几个不同的例子。
以下是作为数据科学家,你可以看到的一些预期的职位,这些职位的工资也可能会有很大的变化:
入门级数据科学家→数据科学家→高级数据科学家
首席数据科学家-数据科学经理-数据科学总监
除了这些头衔,还有一些资历级别,如I级、II级和III级。
下面,我将按职称和他们各自所需或预期的年数显示工资范围。
请记住,这些角色基于美国平均值(基于PayScale[3]):
我同意这些数字吗?
没有。
如果你读过以前的文章,下面是我将包括不同城市的报告工资,以及不同的技能。
以下是具体的城市和技能:
城市的平均工资本身似乎更符合现实,而与城市相关的具体技能似乎太低了。我相信这是因为当你按照特定的技能进行过滤时,你就会剥离掉所有其他的技能。因此,一个解决办法可能是找到城市的平均工资,然后比较以上技能之间的差异,以获得更现实的工资估计。
我确实认为NLP技能不如Tableau有利可图是很有趣的,然而,我认为NLP可能太具体了,可能更少被误解,而Tableau被广泛理解,大多数数据科学家不认为在他们的简历中添加这一点,因为它更多的是面向数据分析师的--在你意识到你的工资或编辑你的简历时,这一点可能需要记住--长话短说,不要做假设,用你的技能来寻找独特的东西。
我不知道很多使用Java的数据科学家,但我确实认为这些报告中包含的数据有这种技能作为选择是很有趣的,所以也许Java有一个市场,原因我不确定(也许,这是软件工程师向数据科学家的过渡)。
现在,我们对数据科学的工资有了很好的了解,包括不同的因素,如地点和技能,让我们更深入地研究一下更具体的数据工程师工资是什么样子的。
在所有这些薪酬比较中,数据工程师和数据科学家似乎有一个更相似的范围,我们将在下面看到。
以下是作为一名数据工程师,你可以看到的一些预期的职位,这些职位的工资也可能会有很大的变化:
数据工程师→高级数据工程师→数据工程经理
首席软件工程师-数据科学家(是的,专攻数据工程)
除了这些头衔,还有一些资历级别,如I级、II级和III级。
下面,我将按职称和他们各自所需或预期的年数显示工资范围。
请记住,这些角色基于美国平均值(基于PayScale[5]):
我同意这些数字吗?
没有。
我认为每个职位至少应该换一次,因为在职业生涯早期,工资应该是职业生涯中期或有经验的数据工程师的工资,这也取决于你住在哪里--所以让我们深入研究具体的平均位置。
这些城市平均数比总体平均数更有意义。最有趣的是旧金山的不同,然而,仍然是意料之中的,因为那里的生活成本高得令人难以置信。
现在,让我们来看看这些城市的具体技能:
在所有这些工资中,旧金山市的工资在增加一项技能时有所下降--这一声明重申,在查看个性化报告时,你可能想增加所有技能,而不仅仅是一项技能。纽约看到了Scala最大的进步,我个人同意这一点,因为它是一项伟大的技能,很难掌握。
Salary has several characteristics that can either allow it to increase or decrease. We just talked about two factors, years of experience, location (city) and skills. There are other factors to consider as well, including, but not limited to: the interview itself, resume itself, negotiation skills, bonuses, shares, education, and certifications.
概括地说,以下是数据科学家与数据工程师薪酬的一些关键要点:
*美国数据工程师平均薪金92,519美元
*这两个职位的薪酬范围可能最相似
*数据科学家更专注于从现有的Python打包机器学习算法中创建模型,而数据工程师更专注于利用SQL对数据进行ETL/ELT
*有几个因素影响工资,最重要的可能是资历、城市和技能
我希望你觉得我的文章既有趣又有用。如果你同意或不同意这些工资比较,请随时在下面发表评论。为什么或为什么不?你认为在工资方面还有哪些重要的因素需要指出?这些当然可以进一步澄清,但我希望我能够揭示一些数据科学家和数据工程师工资之间的差异。
最后,我可以再问一遍同样的问题,你如何看待偏远职位对薪酬的影响,尤其是当城市是决定薪酬的一个重要因素时?
我也写了一篇类似的文章,讨论机器学习工程师的工资与数据科学家的工资在这里[6],以及数据科学家和数据分析师的工资在这里[7]的区别。这篇文章概述并强调了每一个,各自的工资的类似特点。请记住,对于这两篇文章,这些都不是我的工资,而是由PayScale和其他实际的数据科学家、数据工程师、数据分析师和机器学习工程师报告的。因此,这些文章是围绕真实数据进行的讨论,目的是让您更好地理解是什么使一个角色(一般)根据某些因素增加或减少工资金额。
同样,这个工资数据是从PayScale收集的,如果你想要一个更具体的估计,那么你可以使用salary survey[8]。
[1] Photo byRyan QuintalonUnsplash, (2019)
[2]Copernicoonunsplash的照片,(2020)
[3]PayScale,数据科学家薪酬,(2021)
[4]照片byFotis FotopoulosonUnsplash,(2018)
[5]PayScale,数据工程师薪酬,(2021)
[6]M.Przybyla,《数据科学家vs机器学习工程师工资》,(2021)
[7]M.Przybyla,《数据科学家vs数据分析师工资》,(2021)
[8]PayScale,PayScale薪酬调查,(2021)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析实战中,我们经常会遇到“多指标冗余”的问题——比如分析企业经营状况时,需同时关注营收、利润、负债率、周转率等十 ...
2026-02-04在数据分析场景中,基准比是衡量指标表现、评估业务成效、对比个体/群体差异的核心工具,广泛应用于绩效评估、业务监控、竞品对 ...
2026-02-04业务数据分析是企业日常运营的核心支撑,其核心价值在于将零散的业务数据转化为可落地的业务洞察,破解运营痛点、优化业务流程、 ...
2026-02-04在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03在数字化业务迭代中,AB测试已成为验证产品优化、策略调整、运营活动效果的核心工具。但多数业务场景中,单纯的“AB组差异对比” ...
2026-02-03企业战略决策的科学性,决定了其长远发展的格局与竞争力。战略分析方法作为一套系统化、专业化的思维工具,为企业研判行业趋势、 ...
2026-02-03在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27