京公网安备 11010802034615号
经营许可证编号:京B2-20210330
九个成为数据科学家的必备技能
Works详细列举了从雇主角度看来,数据科学家加强自身市场竞争力所必备的9个数据科学技能。
过去一年中人们对数据科学的兴趣骤然增长。Nate Silver这个名字已经家喻户晓,所有公司都在寻找独角兽,很多不同学科的专业人才都开始关注这份薪水丰厚的职业,并将其当作自己可能的职业选择。
在Burtch Works开展招聘工作时,我们与很多想要在数据科学这一成长性领域有所发展的分析学专家探讨过,对具体的实施方案提出了疑问。我从招聘者的角度列出了在数据科学方面对成功十分关键,并且是招聘经理首先考虑的一些技术类与非技术类技能。
各公司在技能与工具的价值评判上都不尽相同,因此这个列表绝对谈不上详尽,不过在这些领域有过经验的人会在数据科学上占有更大的优势。
技术技能:分析学1、教育——数据科学家受教育程度都很高,其中88%至少拥有硕士学位,46%有博士学位。虽然有一些名人特例,不过通常来说成为一名数据科学家需要扎实的教育背景,才能掌握所需的深度知识。最常见的研究领域包括数学与统计学(32%),其次是计算机科学(19%)以及工程学(16%)。
2、SAS软件与/或R语言——对其中至少一种分析工具有深入的了解,一般对数据科学来说R语言更好一些。
技术能力:计算机科学3、都是公司在招聘数据科学类角色时最常提出的语言要求。
4、Hadoop平台——尽管不是总有这个需求,不过在很多情况下掌握它的人优势更大。熟悉Hive或Pig也是很有利的卖点。熟悉类似Amazon S3这样的云工具也会很有优势。
5、SQL数据库/编程——尽管NoSQL和Hadoop已经成为了数据科学很大的组成部分之一,招聘者还是希望能够找到可以编写与执行SQL复杂查询的候选人。
6、非结构化数据——数据科学家能够处理非结构化数据这一点非常重要,无论这些数据是来自社交媒体、视频源或者音频的。
非技术类技能7、求知欲——毫无疑问最近到处都能看到这个词,尤其是在与数据科学家关联时。Frank Lo在几个月前的博文中描述了这个词的含义,并且讨论了其他必须的“软技能”。
8、商业智慧——想要成为数据科学家,需要充分了解自己工作的行业,并且知道公司想要解决的商业问题是哪些。能够根据数据科学分辨出解决哪些问题对公司来说更为重要,并且能够找出利用数据的新办法,这些是非常关键的。
9、通用技能——寻找优秀数据科学家的公司想要的是这样的人材:能够清楚顺畅地将自己的技术发现转化为非技术团队(比如市场部或者销售部)能够使用的内容。数据科学家必须能得出可用以决策的量化insight,同时了解非技术团队的需求,可以恰当地进行沟通以传达数据。想要了解定量专家在沟通技巧方面的更多信息,请参见我们近期的调查。
一般接下来的问题都是:“怎样能够获得这些技能呢?”网上有很多资源,不过笔者不希望让读者产生这样的错觉——成为数据科学家非常简单,上几节MOOCs就够了。除非你有扎实的定量经验,否则成为数据科学家之路还是颇有挑战的——但也并非不可能。
不过只要你确实对数据有兴趣、有激情,并打算将生命投入到相关的学习上,那么就不要让经验背景成为你追求数据科学生涯的阻碍。下面是我们觉得有用的一些资源:
1、高等学位——为了满足目前的需求,如雨后春笋般出现了更多的数据科学专业的项目,不过数学、统计学与计算机科学专业的项目也有很多。
2、MOOCs——Coursera、Udacity还有codeacademy都是不错的入门方式。
3、证书——KDnuggets编写了一个很长的列表清单。
4、Bootcamps——想要了解这种方式与学历项目或MOOCs的对比情况。
5、Kaggle——Kaggle上有数据科学竞赛,可以进行演练,用杂乱的真实世界数据来磨练技巧,解决真实的商业问题。雇主对Kaggle排名很重视,该排名可以被看作是相关的、经过亲身实践的项目工作。
6、LinkedIn小组——加入相关的小组,与数据科学社区的其他成员互动。
7、数据科学中心与KDnuggets——数据科学中心与KDnuggets都是保持与数据科学行业趋势前沿同步的优秀资源。8、Burtch Works研究:关于数据科学家的薪金,如果想要了解更多信息与当前数据科学家人数统计的话,请下载我们的数据科学家薪金研究报告。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23在CDA(Certified Data Analyst)数据分析师的日常工作与认证考核中,分类变量的关联分析是高频核心场景。用户性别是否影响商品 ...
2026-03-23在数据工作的全流程中,数据清洗是最基础、最耗时,同时也是最关键的核心环节,无论后续是做常规数据分析、可视化报表,还是开展 ...
2026-03-20在大数据与数据驱动决策的当下,“数据分析”与“数据挖掘”是高频出现的两个核心概念,也是很多职场人、入门学习者容易混淆的术 ...
2026-03-20在CDA(Certified Data Analyst)数据分析师的全流程工作闭环中,统计制图是连接严谨统计分析与高效业务沟通的关键纽带,更是CDA ...
2026-03-20在MySQL数据库优化中,分区表是处理海量数据的核心手段——通过将大表按分区键(如时间、地域、ID范围)分割为多个独立的小分区 ...
2026-03-19在商业智能与数据可视化领域,同比、环比增长率是分析数据变化趋势的核心指标——同比(YoY)聚焦“长期趋势”,通过当前周期与 ...
2026-03-19在数据分析与建模领域,流传着一句行业共识:“数据决定上限,特征决定下限”。对CDA(Certified Data Analyst)数据分析师而言 ...
2026-03-19机器学习算法工程的核心价值,在于将理论算法转化为可落地、可复用、高可靠的工程化解决方案,解决实际业务中的痛点问题。不同于 ...
2026-03-18在动态系统状态估计与目标跟踪领域,高精度、高鲁棒性的状态感知是机器人导航、自动驾驶、工业控制、目标检测等场景的核心需求。 ...
2026-03-18“垃圾数据进,垃圾结果出”,这是数据分析领域的黄金法则,更是CDA(Certified Data Analyst)数据分析师日常工作中时刻恪守的 ...
2026-03-18在机器学习建模中,决策树模型因其结构直观、易于理解、无需复杂数据预处理等优势,成为分类与回归任务的首选工具之一。而变量重 ...
2026-03-17在数据分析中,卡方检验是一类基于卡方分布的假设检验方法,核心用于分析分类变量之间的关联关系或实际观测分布与理论期望分布的 ...
2026-03-17在数字化转型的浪潮中,企业积累的数据日益庞大且分散——用户数据散落在注册系统、APP日志、客服记录中,订单数据分散在交易平 ...
2026-03-17在数字化时代,数据分析已成为企业决策、业务优化、增长突破的核心支撑,从数据仓库搭建(如维度表与事实表的设计)、数据采集清 ...
2026-03-16在数据仓库建设、数据分析(尤其是用户行为分析、业务指标分析)的实践中,维度表与事实表是两大核心组件,二者相互依存、缺一不 ...
2026-03-16