京公网安备 11010802034615号
经营许可证编号:京B2-20210330
当你考虑你的第一份数据科学工作或你的下一个数据科学职位时,你会想问自己什么是重要的。对我来说,我在数据科学方面有过几个职位,这些是我认为在选择下一份工作时必须考虑的一些最关键的问题。
学习数据科学通常包括掌握机器学习算法,但有一个很大的部分在学术界经常被忽视,那就是这些算法的运算。原因可能是有许多不同的方法来部署您的模型,并且许多选项可能包括已经集成到您的业务中的昂贵的特定平台。由于这种可变性,学校或项目可能会选择不在教学大纲中包括操作,这是可以理解的。
话虽如此,您很可能想问这项工作是否是您作为数据科学家的责任,或者是否有一个专门的MLOps工程师(或机器学习工程师等)。当然,有些人可以做到这两个方面,并且更喜欢掌握创建和部署模型过程的两个部分,但是仅仅是专注于算法的数据科学家也是可以的。与你未来或现在的经理明确这个定义甚至更重要。
与上述考虑类似,您将想要询问您的团队中是否有SQL专家。一些数据科学职位几乎不需要SQL,而其他职位几乎每天都需要SQL。在您的面试中,您将希望缩小您可以期望执行的SQL的数量,以及您是否是唯一的SQL。
有时,还有其他人,如数据分析师、业务分析师或数据工程师,他们更像是一名专家,使用SQL。然而,在一些数据科学职位上,您将被要求在建模过程之前和之后查询您的数据。
在进入一个专业数据科学家角色之前,一次一个项目听起来似乎是一项简单的任务,但它可以很快变成一个全职项目。
对于任何一个特定项目,您都可以执行以下步骤:
数据科学的一些职位会有一个项目,只有一个人在上面工作,而在其他角色中,有几个人在同一个模型上工作。人们按照自己的节奏前进,与其他日子相比,有或多或少的效率,每天都可以享受或不享受与其他人在同一个项目上工作。
最终要由你来决定你喜欢什么,同样重要的是在进入一个角色之前知道你的期望是什么。
算法/模型创建的测试快得惊人。在开发一个模型并将其集成到您的业务中时,前后部分可能会占用大部分时间。
对于任何项目来说,时间线都可以波动,就像上面的其他考虑一样,它是关于期望的--需要多少工作才能获得有用的结果。
总的来说,重要的是要记住,当你接受数据科学角色(或任何角色)的面试时,你应该同样地面试他们,这些只是你可以问和提出的一些问题或考虑因素。此外,即使在当前的角色中,您仍然可以提出这些问题。
概括地说,在选择下一份数据科学工作之前,需要记住以下五点:
谢谢你的阅读。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01