京公网安备 11010802034615号
经营许可证编号:京B2-20210330
认为你的公司需要数据科学家?你可能错了
当我在15年前开始从事数据工作时,我从未想过近年来数据科学家会如此备受追捧。如今,数据科学家被认为是全球最热门的职位之一,市场上对数据科学家的需求供不应求。
创业公司在产品生命周期的早期招聘数据科学家的情况并不罕见。其实很多情况下,他们并不需要数据科学家。
作为一名数据科学方面的倡导者,为什么我会这么认为呢?
首先,我想声明的是雇用数据科学家确实有很多好处。如果使用得当,数据科学家将成为强大的商业武器。我想强调的是,数据科学当中涉及到大量的数据相关操作和技巧,这不是在短期培训中就能掌握的。
因此,当企业需要聘请数据科学家时,需要慎重考虑应该何时聘请哪种数据科学家。
当企业打算聘请数据科学家之前,可以先试着问自己以下四个问题:
1. 有多少数据?
如果你是一家尚未启动的创业公司,那么你们可能并不需要全职数据科学家。其实,如果你的公司已经发展的较为成熟,但只有小规模的客户、产品或会员基础,那么你也不需要数据科学家。
为什么呢?显然数据科学家需要数据。不是任何数据都可以。许多技术需要至少数万个、甚至数百万个数据点才能构建。
如今,深度学习备受关注。在针对数据科学家的工作描述中充满了神经网络、计算机视觉和自然语言处理等术语。而这类技术依赖于大量的训练数据。谷歌翻译就是建立在超过1.5亿个词汇基础上的神经网络。成功部署这型模型所需的数据量超过了许多公司加起来的数据总量。
很多技术比深度学习使用更少的数据,但是当中仍然需要相当大的样本,还需要能够判断何时使用哪种方法的知识储备。目前需要大量的投入才能创建数据科学所需要的环境,拥有资金和昂贵的资源是远远不够的。
2. 是否有已制定的关键绩效指标(KPI)和商业智能报表?
如果没有对企业驱动因素的基本了解,那么将难以利用先进技术。
数据科学家能够通过机器学习进行预测,例如哪些用户会流失、哪些用户很活跃。但是如果缺乏对流失和高度活跃的定义,那么在构建预测模型之前会遇到问题。
此外,如果没有足够的指标进行评估,那么将很难验证模型。A/B测试等其他技术需要总体评估标准(OEC),这通常是业务驱动的KPI。
3. 数据科学家要做什么?
这是四个问题中最主观和最有趣的问题,“你想让数据科学家做什么?”我得到的最常见的答案是:“我们不知道,这也是为什么我们需要雇用一位。”
在这种情况下,我会告诉该企业这是行不通的。虽然聘请数据科学家时,你并不需要成为该方面的专家,但是你应该清楚哪些是可行的、哪些是不可行的,从而不会设定不切实际的期望。
数据科学不是魔术,但也不是传统科学。数据科学是一门艺术,也是一门科学,这意味着当中技术和能力的可变性很大。企业可以考虑让现有团队的成员发展成数据科学家。对现有分析师来说,进入数据科学领域的方式之一是对现有的KPI进行预测。一方面,他们有机会学习熟悉的数据; 另一方面,对现有员工进行投资意味着将来市场招聘的需求减少。
4. 数据科学家有哪些内部支持?
如果数据科学家在你的企业没有适当的支持,那么请不要为招募他们而投资。近年来,数据科学课程数量激增,然而许多毕业生并没有准备好解决业务问题。绝大多数课程都让学生解决预先清洁好的数据。在现实世界中,干净的数据并不存在。
在没有高级数据科学家指导的前提下,聘请初级数据科学家并不明智,初级数据科学家会遇到难题,而且往往会导致错误的分析。初级的数据科学家团队难以将业务问题转化为技术问题,而错误的分析会导致任务难以完成。
聘请高级数据科学家并不能完全缓解这个问题,部分原因在于很难证明雇佣人员的水平和资历。如果你很幸运地聘请到优秀的人员,他仍然需要来自领导团队的大量支持。比如,创建从未使用过的模型;或者进行A/B测试但结果被忽略。更糟的是,分析问题所需的数据并没有被收集。
通常,必要的第一步是强大的数据收集程序,这需要由工程师或数据库管理员提供,而不是数据科学家。在很多企业中,高级数据科学家需要花大量时间完成数据需求和团队部署,而这很容易导致高级数据科学家的流失。
结语
招聘和留住优秀的数据科学家的成本是很昂贵的。但如果能明确何时聘用、如何聘用、聘用哪种人才,则能够有效地减少成本。
不要陷入招聘广告的陷阱,那些只是对工作技能的简单罗列。不要奢望数据科学家会魔法。一定要明确自身的真实需求,如果可能的话,在进行招聘之前咨询专业人员。企业数据方面的成功取决于以上这几点。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16