京公网安备 11010802034615号
经营许可证编号:京B2-20210330
世界上任何有规模的现代公司都有一个数据科学部门,一家公司的数据工程师可能与另一家公司的营销科学家有相同的职责。数据科学工作没有很好的标签,所以一定要广撒网。
分享69
在科技界的所有角色中,数据科学家的头衔和工作职责的变化可能是最大的。数据科学家必须戴上很多不同的帽子,亚马逊的数据科学家的日常工作可能与微软的数据科学家的工作有很大不同。从找到公司业务中可以从收集、分析和理解数据中受益的领域,到决定必须做出什么战略决策以提高客户满意度或购买完成率,公司可以向数据科学家提出很多要求。
一个数据科学家被期望拥有专业的统计学、机器学习,通常还有经济方面的技能和知识。一个数据科学家需要在数学、统计学、机器学习、可视化、沟通和算法实施方面有很高的技能。
此外,数据科学家必须彻底了解其数据的商业应用。如果你在分析树木的生长数据,你应该了解高度和树冠基部高度之间的区别。这种背景知识可以在工作中培养,但如果你想成为一名数据科学家,如果你已经有了行业工作经验,这可能是一个很大的优势。如果你已经做了五年的银行家,那么你在金融科技领域获得数据科学职位的几率要比在医疗保健领域好得多。
数据科学家所戴的各种帽子
数据科学是一个相对较新的领域,对于不是数据科学家的人来说,要向普通人解释数据科学家的工作可能很困难。这就导致了现代数据科学家有时会有各种滑稽的职责和头衔可以适用。
一个数据科学家,根据公司和具体的工作,可以负责数据收集和清理。你也可能被要求开发机器学习模型和管道,或作为可视化大师为公司服务。一些数据科学家更多的是面向内部,而另一些则与内部的、非技术团队甚至客户有很多关系。如果你和技术性不强的人一起工作,你就必须有出色的沟通技巧,既要写报告来总结你的分析,也要介绍你的发现,并为未来的行动提出建议。
数据科学家(或者你们公司对收集、分析、可视化或预测数据的人的任何称呼)的关键职责是讲述数据的故事。它是从哪里来的,我们可以从它那里了解到过去的情况,以及它如何在未来指导我们?为了成功地做到这一点,你需要成为业务领域的专家,或者拥有背景知识,将拼图的碎片拼凑起来,并向你周围的人解释数据的意义和你从中获得的洞察力。
数据科学领域内的具体职责差别很大,而且数据科学领域内有很多不同的角色。无论你是想进入这个领域还是想转换工作,在工作职位和行业方面保持开放的心态真的很重要。我给你分析一下数据科学领域内十三个不同角色的一般职责。
公司一般不善于给数据科学领域的人冠以头衔,所以你一定要把这个细目作为一个经验法则,而不是一个确切的定义。如果其中一个听起来很完美,那么你可以把你的搜索范围缩小到这一个头衔,但如果其中几个听起来都不错,那么我会在搜索时对你使用的头衔更加灵活。(如果头衔对你来说真的很重要,当你得到工作机会时,你总是可以把它作为你谈判的一部分!)
世界上任何有规模的现代公司都有一个数据科学部门,一家公司的数据工程师可能与另一家公司的营销科学家有相同的职责。数据科学工作没有很好的标签,所以一定要广撒网。
数据科学家的职责按角色细分
1. 数据分析师
数据分析师更注重于数据的收集、清理和汇总。你必须能够自如地驾驭复杂的SQL查询。你将负责设计并向非技术性的利益相关者提供报告。你也会有机会设计数据模型、可视化和预测模型。
2. 数据库管理员
数据库管理员管理数据库实例,包括内部和云实例。作为一名数据库管理员,你要建立、配置和维护生产环境。你还将负责你所负责的数据库的性能、可用性和安全性。准备好带头进行数据操作并提供关键任务的随叫随到支持。
3. 数据建模员
数据建模人员创建概念性的、技术性的、逻辑性的、有时是物理性的数据模型。你必须果断地选择和维护数据建模和设计标准,为你公司的数据创造一个有凝聚力的愿景。
数据建模人员还必须开发实体关系模型和设计数据库。你可能需要为你的团队或公司改进数据收集和分析代表性不足的数据类别,以确保你的数据集具有代表性。
4. 软件工程师
软件工程师设计和维护软件系统。当你成为一名软件工程师时,准备好编写可扩展、可靠和高性能的代码。你必须将设计要求转化为有据可查、经过良好测试的代码,将产品设计师的设想变为现实。
5. 数据工程师
识别和解决数据质量挑战将是你作为数据工程师的一项重要任务。你还需要支持将数据源纳入数据存储解决方案。数据工程师工作的一个令人兴奋的部分是有机会架构和设计数据工程解决方案。你还应该准备好建立ETL管道,以提取、转换和加载数据到数据仓库,用于下游报告。数据工程师还负责数据复制、提取、加载、清理和整理。
6. 数据架构师
数据架构师主要负责设计和维护数据管道。数据架构师工作的另一个重要部分是管理数据库。作为一个数据架构师,你将编写高效的查询,并优化现有的查询,以最大限度地提高可扩展性和成本效益。你还将把数据转化为可操作的报告、自动化和洞察力。
7. 统计员
统计学家了解业务需求,提出假设,并构建统计学上合理的实验。作为一名统计员,你将验证其他业务组的实验计划的统计有效性。你还需要指导和培训项目或研究主任开发统计学上合理的实验和验证策略或指标。
除了实验之外,统计员还要制定和执行分析报告策略。你可能需要像一个统计学的拉拉队员一样,因为一些数据科学公司让他们的统计员积极推广统计学方法,并发现可以从统计学上的分析中获益的新业务领域。
8. 商业智能分析师
商业智能分析员是数据科学中比较柔和的一面。作为一个商业智能分析师,你需要收集业务和功能需求,并努力使技术解决方案与业务战略保持一致。你还将致力于创建或发现数据采购和处理策略。
你将负责提取和处理大量的数据,从中创建分析报告。商业智能分析师还将向关键的利益相关者报告、介绍和沟通分析结果。
9. 营销科学家
营销科学家向当前和潜在的客户展示想法和发现。他们还将数据挖掘和分析策略应用于数据,如人口统计或营销数据。根据Stone Alliance Group对营销科学家的描述,你必须 "跟踪和评估客户获取工作、市场趋势和客户行为"。营销科学家是专门从事广告、营销或用户/客户人口统计学数据的数据科学家。
10. 商业分析师
根据MaxisIT Inc的要求,业务分析师 "分析业务和用户需求,记录需求,并设计系统和报告的功能规格"。如果你是一名业务分析员或想成为一名业务分析员,你需要了解业务和行业要求,并利用它们来制定系统范围和技术目标。你还将负责定义不同系统和数据库之间的数据互动。
11. 量化分析员
定量分析员使用大型数据集开发复杂的模型,为内部报告提供信息,并产生商业洞察力。资源开发协会让他们的定量分析员 "开发和领导分析计划的实施,概述研究方法、问题、抽样和迭代计划"。定量分析员还将工作流程自动化,并努力验证数据的完整性。
12. 数据科学家
作为一名数据科学家,你将被期望从多个来源提取、汇总、清理和转换数据。你将需要确定问题的重要背景因素。数据科学家通过分析数据,为企业产生关键的可操作的见解,以提高业绩。根据公司的情况,你可能需要预测市场趋势,以帮助公司战略性地发展其分支机构。
数据科学就是要在短期分析指导和长期预测和实验之间找到平衡。你需要在正确的时间沟通重要的事情,所以你能以可消化的媒体--数据可视化和吸引人的、深思熟虑的演讲--来呈现研究结果,这一点至关重要。
作为一名数据科学家,你将为非技术性的利益相关者带来数据的价值和洞察力。你将有机会主动找到公司内部可以从数据驱动的决策中受益的领域,并与其他团队合作来完成这一任务。
13. 机器学习工程师
为生产建立机器学习模型是机器学习工程师的主要重点。他们设计和实施可扩展的、可靠的、性能良好的数据管道和服务。根据公司和它的重点领域,你可以改善产品的个性化,或者通过将机器学习模型应用于历史和实时数据,更好地预测行业的市场趋势。
角色和职责相互交叉,区别仍然很重要
所有这些角色之间有很多交叉的地方。有些人更专注于纯粹的数字计算,而另一些人则更专注于将数据分析产生的洞察力应用于商业决策。无论你的具体职位是什么,如果你在数据科学领域,你将被期望参与数据驱动的产品开发周期中的许多不同步骤。你应该准备好发现新的优化领域,弄清楚重要的指标,寻找数据来告知这些指标,设计和执行实验,并以简洁、准确和令人信服的方式展示实验/模型的结果。
数据科学领域很年轻,定义也很松散。很多时候,你会发现在数据科学的大伞下,不同的工作头衔下的工作描述听起来惊人的相似。公司往往意识到他们有数据或可以收集数据,然后用它来改善他们的商业模式。然而,这些工作描述和他们选择分配的工作头衔往往是由非技术人员撰写的,这意味着有很多重叠之处。
一家公司的数据工程师可能与另一家公司的数据分析师做同样的工作。所有这些职位都涉及到收集或验证数据,应用某种形式的分析,然后通过报告、预测或可视化向非技术类同事解释结果。
如果这些工作中有一个听起来很完美,那么你可以把搜索范围缩小到这一个职位,但如果其中有几个听起来不错,那么我会在搜索时对你使用的标题更加灵活。如果头衔对你来说真的很重要,当你得到工作机会时,你总是可以把它作为你谈判的一部分。不要让这份责任清单把你从一份听起来很有趣的工作中吓跑了。如果你真的想成为一个数据建模者,但你对组织行文信息不适应,你可以看看不同公司的数据建模者职位或数据架构师职位。
让这十三种最常见的数据科学角色的细分成为你寻找数据科学工作的跳板。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27