京公网安备 11010802034615号
经营许可证编号:京B2-20210330
如何成为一名数据科学家并得到一份工作
大数据科学家被认为是21世纪最性感的职业,且未来薪水优渥。其工资高达10万美金每年,而市场对最优秀的数据科学家的需求正强劲。另一方面,很多20世纪流行的工作将会因为机器人,人工智能和机器学习的发展而消失。那么,如何做才能确保自己得到这份性感的工作,成为一名数据科学家并被雇佣呢?
出人意料的是,一切都是从获得正确的技能开始。成为一名数据科学家的挑战在于,你需要掌握一长串技能来确保自己得到一份工作。前些时候,我发表了一篇文章,描述了大数据科学家的典型职业要求,同时其他的图表也表明,成为一名大数据科学家,有很长的路要走。但是,至2020年时,英国将有56000名大数据科学家缺口,美国将有14万至19万缺口,成为一名大数据科学家无疑是值得追求的。
能够选择正确的技术
一个数据科学家应该能够在不同数据源中成千上万的数据点中发现规律,并能够从那些可用于制定决策的规律中得出洞见。数据科学家应当能够发现可以促使优化这些洞见的关键条件,比如一个工厂中的传感器数据或者识别零售行业中的客户行为因果关系。基于这些要求,数据科学家应当能够选择最优的工具和技术来得到最好的结果。所以,大数据科学家应当能够明智地从一堆技术中选出可以最优化结果的方法,而不是仅仅知道很多不同的技术方法。
理解商业背景
当然,要选择正确的技术方法需要对具体行业有了解,并且更重要的是,要能正确理解商业背景。在一个数据科学家一头扎进数据的海洋之前,他或她应当明确理解数据应用的背景并深刻理解眼前的问题。要做到这一点,最好的办法是和商业伙伴进行合作,向他们提问来弄清楚问题背景,以便彻底明白需要做什么。所以一个数据科学家也需要对商业模式是如何运作的有一些了解,了解到什么程度取决于公司和行业的规模。
不同的行业有不同的问题,不同的问题要求不同的解决办法。为了在某一具体行业找到一份工作,你需要对这个行业有一些认知,来帮助你更好的理解商业背景。对商业背景更深入地了解可以促使你形成更优的洞见。
通过项目来获得工作经验
对于初入职场的数据科学家来说,特别是有雄心壮志的人,他们需要有处理不同来源数据和解决各种各样问题的经验。尽管大数据科学家人才短缺,如果想得到这份工作的话,展示相关经验仍然是十分重要的。当然,有一点儿经验听起来很容易办到,但是做过越多不同的项目,你才能掌握更多的技能并且更好的理解不同的商业模式。诸如由哈佛创新实验室开发的Kaggle和Experfy这样的网站,能够帮你获得相关经验并助你得到最喜欢的公司的理想工作。
给组织机构的福利:雇佣合适数据科学家的建议
对于各种组织机构来说,雇佣到合适的数据科学家也是一个挑战。在此我给出三点相关建议:
由于人才短缺,最合适的数据科学家现在可能并没出现。掌握不同技术的顶尖数据科学家甚至根本不存在。所以如果你想开展大数据战略,找一个既有行业知识又有基本数据分析技能的专业人士吧。以此为起点,这个数据科学家也可以从工作中学习和提升技能。
合适的数据科学家可能远在千里之外。要么你可以等待这种局面的改变(有数据科学家搬到单位所在城市),要么你可以试着让你看中的人才搬到单位附近或者开展远程办公。数据分析活动可以远程开展,而通过视频会议,你们仍可以进行合作。
培训现有职员并让他们互相学习。你可以看看是否可以培训现有雇员并让他们提升技能,而非雇佣一个昂贵的数据科学家。甚至可能你已经雇了一个数据科学家而你自己都不知道。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09