京公网安备 11010802034615号
经营许可证编号:京B2-20210330
When looking at data scientist salaries and data science roles, it became obvious that there are different, more specific facets within data science. These facets relate to unique job positions, specifically, machine learning operations, NLP, data engineering, and data science itself. Of course, there are even more specific positions than these, but these can give you a general summary of what to expect if you land a job in one of these positions. I wanted to pick these four roles, too, because they can be separated well, almost as if it was there was a clustering algorithm that found jobs that were the most different between one another but that were also in the same population. Below, I will be discussing the average base pay with a low and high range, as well as respective seniority levels, the number of estimates used to determine these numbers, and expected skills and experiences for each role.
机器学习工程师倾向于将已经研究和构建的数据科学模型应用到生产环境中,通常包括软件工程和机器学习算法知识。话虽如此,你可以想象得到相当不错的薪水。这个特别的估计来自于GlassDoor[3]。
根据大约1900提交的工资,有以下广泛的范围:
正如你所看到的,这是一个范围,就像任何职位一样,你的经验越多,工资越高也就不足为奇了。除了多年的经验,你工作的州,你雇用的技能,公司也会努力创造最终的工资数额--所有这些职位都是如此。为了获得更多的粒度,我们可以查看不同的资历级别,以便了解级别的增加与工资数额的关系:
以下是一些来自个人经验的技能,您可以期望在机器学习职位上使用:
通常被称为NLP工程师,这个角色通常专注于将数据科学模型或机器学习算法应用于文本数据。NLP工作的一些例子是主题建模、大量文本、语义分析和chatbot代理。话虽如此,你也可以想象出相当不错的工资--然而,这个工资细目将低于机器学习工程师,很可能是因为这个角色不太包容,更专注于数据科学中的特定主题。这个特别的估计也来自于Glassdoor[5]。
根据大约20提交的工资,有以下广泛的范围:
值得注意的是,报告的工资数额相当低,所以对这个范围持怀疑态度,但尽管如此,对这个工资仍然有很高的信心。
所有这些数量都低于机器学习,然而,与大多数其他角色相比,它们仍然相当高。
以下是一些来自个人经验的技能,你可以期望在自然语言处理工程师的职位上使用:
也许一个更常见的角色是数据工程,它与数据科学比在数据科学之下更相关。然而,这个角色对数据科学工作来说仍然至关重要,有时,数据科学家可以期望知道数据工程师所知道的大部分内容,所以我将在本文分析中包括它。数据工程的一些示例包括创建存储最终用于数据科学模型的数据的ETL作业,以及自动存储模型结果和执行查询优化。这个特别的估计也来自于Glassdoor[7]。
根据大约~6,800提交的工资,有以下广泛的范围:
这个范围更类似于自然语言处理工程师的角色,然而,它可能与日常工作中的实际工作角色相距最远。同样重要的是要注意,这个职位涉及到相当多的估计。
以下是一些来自个人经验的技能,您可以期望在数据工程师职位上使用:
最后,但并非最不重要的,是数据科学家的角色。虽然这个角色看起来是最一般的,但实际上也可以是具体的,通常主要由模型构建过程组成--有时需要数据工程和机器学习工程师操作,但可能性较小--但仍然可能涉及自然语言处理方面的专业(通常如果重点是NLP,那么数据科学家将以此为标题--但不是一直)。这个角色还可以有更多的可变性,所以我们也可以期待一个广泛的范围。这个特别的估计也来自于Glassdoor[9]。
根据大约~16,200提交的工资,有以下广泛的范围:
出人意料地低于预期,这一角色在本分析中的大多数其他角色附近。话虽如此,它可能是对离群值最真实和稳健的,因为它是迄今为止提交来组成这些工资数额的最多的工资数额。
以下是一些来自个人经验的技能,您可以期望在数据科学职位上使用:
While these roles can have several similarities and differences, the same can be said about their salary ranges. Nearly three of the four salaries were similar, with one standing out. That role was machine learning engineer —why is that?My understanding is that this role requires a knowledge of most data science concepts, and especially their output, as well the software engineering involved around deployment — that is a lot to know and employ, so it makes sense why a role that composes both software engineering and data science pays so well. In addition to the salary breakdown of each data science role — or similar to data science in some way, were the skills that you can expect to employ, so that you can have a better idea of the role and how that relates to the salary amount.
总结一下,以下是我们分析的四个职位,以及你可以期望使用的技能:
我希望你觉得我的文章既有趣又有用。如果你同意这些数字和范围,请随时在下面发表评论--为什么或为什么不?你认为有一个角色,尤其是,离现实如此之远吗?你还能想到哪些数据科学角色会有不同的工资细分吗?一个角色的其他因素会影响薪水吗?
这些薪金是在美国报告的,因此它们是以美元数额计算的。我与这些公司中的任何一家都没有关联。
请随时查看我的个人资料和其他文章,并在LinkedIn上联系我。
[1] Photo byThought CatalogonUnsplash, (2018)
[2]Photo Byassed PhotographyonUnsplash,(2018)
[3]Glassdoor,Inc.,机器学习工程师工资,(2008-2021)
[4]Photo Bybatrick TomassoonUnsplash,(2016)
[5]Glassdoor,Inc.自然语言处理工程师工资,(2008-2021)
[6]Caspar Camille RubinonUnsplash的照片,(2017)
[7]Glassdoor,Inc.,数据工程师工资,(2008-2021)
[8]照片byDaria NepriakhinaonUnsplash,(2017)
[9]Glassdoor,Inc.,数据科学家工资,(2008-2021)
Bio: Matthew Przybyla is Senior 数据科学家 at Favor Delivery, and a freelance technical writer, especially in data science.
原创。经允许转发。
相关:
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26表格结构数据以“行存样本、列储属性”的规范形态,成为CDA数据分析师最核心的工作载体。从零售门店的销售明细表到电商平台的用 ...
2025-11-26在pandas数据处理工作流中,“列标签”(Column Labels)是连接数据与操作的核心桥梁——它不仅是DataFrame数据结构的“索引标识 ...
2025-11-25Anaconda作为数据科学领域的“瑞士军刀”,集成了Python解释器、conda包管理工具及海量科学计算库,是科研人员、开发者的必备工 ...
2025-11-25在CDA(Certified Data Analyst)数据分析师的日常工作中,表格结构数据是最常接触的“数据形态”——从CRM系统导出的用户信息表 ...
2025-11-25在大数据营销从“粗放投放”向“精准运营”转型的过程中,企业常面临“数据维度繁杂,核心影响因素模糊”的困境——动辄上百个用 ...
2025-11-24当流量红利逐渐消退,“精准触达、高效转化、长效留存”成为企业营销的核心命题。大数据技术的突破,让营销从“广撒网”的粗放模 ...
2025-11-24在商业数据分析的全链路中,报告呈现是CDA(Certified Data Analyst)数据分析师传递价值的“最后一公里”,也是最容易被忽视的 ...
2025-11-24在数据可视化实践中,数据系列与数据标签的混淆是导致图表失效的高频问题——将数据标签的样式调整等同于数据系列的维度优化,或 ...
2025-11-21在数据可视化领域,“静态报表无法展现数据的时间变化与维度关联”是长期痛点——当业务人员需要分析“不同年份的区域销售趋势” ...
2025-11-21