京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据科学家也良莠不齐 蹩脚数据科学家的10个迹象
1.优秀的数学家可以成为顶尖的数据科学家,但光是会在笔记本上写公式可不行,他们还必须熟练地运用计算机来处理数据。
2.如果他们的所有经验都来自学术机构,当他们面对现实问题时,可能会束手无策。寻找有实践经验的人,不要在这方面妥协。
3.对数据科学的热情以及掌握一定的技能,这是成功的关键。如果你只是假装有兴趣,或者并不具备重要的技能,总有一天,你会原形毕露。
如今,数据科学家已是炙手可热,那些曾经对其毫无所知的企业,眼下也开始在全世界搜寻最好的数据科学家。问题在于,优秀数据科学家的标准是什么?和其他东西一样,数据科学家也是良莠不齐,招聘他们是一项重要的投资,如果选了个“次品”,你会付出沉重的代价。凭借一批出色的数据科学家,Facebook为自己的社交媒体平台注入了富有创造力的新功能,令用户为之兴奋。
过去10年里,数据呈现爆炸式增长。大数据扑面而来,普通人很难弄懂它的含意,更别提加以利用了。但数据科学家能从中提取出有价值的信息。对一家公司来说,数据科学家的雇用成本很高,由于这方面的人才供不应求,他们的薪水会迅速上涨。
在当今这个时代,解雇员工同样代价不菲,错误的招聘会使你的公司倒退几个月。所以,在寻找优秀的数据科学家时,你也应该警惕蹩脚数据科学家的迹象。如果发现以下10个迹象中的任何一个,你都应该迅速远离。
1. 糟糕的数学背景
许多计算机专家和程序员都会把自己说成是数据科学家,但实际上,真正出色的数据科学家通常拥有数学背景。优秀的数学家可以成为最好的数据科学家,但数学不好的程序员不行。蹩脚的数学家无法有效地分析数据,而这恰恰是数据科学家的首要任务。
2. 计算机知识贫乏
没错,优秀的数学家可以成为顶尖的数据科学家,但光是会在笔记本上写公式可不行,他们还必须熟练地运用计算机来处理数据,要熟悉Spark和其他系统。如果你的数据科学家坚持要求配一名助手,因为他用不来电脑,那么你应该继续寻找,去雇用其他人。
3. 没有全能型人才
一个人集统计学家、开发员、数学家和其他身份于一身,并不意味着他能成为一名数据科学家。几乎可以肯定的是,他拥有跨领域知识,能够根据不同的职位需求来推销自己。他也许什么都会,但可能什么都不精。
4. 纯粹的学术派
你需要有实践经验的人。如果他们的所有经验都来自学术机构,当他们面对现实问题时,可能会束手无策。寻找有实践经验的人,不要在这方面妥协。
5. 缺乏团队精神
数据科学家将和其他人共事,所以你不会想要一个不合群的人,即便他再怎么聪颖过人。数据科学家应该真正地融入团队,了解整体情况,做出全面改进。而如果他们不能和其他人融洽相处,就做不到这一点。
6. 缺乏商业知识
数据科学家不能只会运用理论。他们还要重视经过验证的技巧,运用可靠的传统方法。这些都来自于实践经验。
数据科学家需要参加商务会议,通过演示向高级管理层阐述分析结果。因此,在雇用一名数据科学家之前,要确保他拥有一定的商业知识,这一点非常重要。
7. 不熟悉工具
你面前的那个人拥有丰富的技术知识,但他们能否运用这些知识?如果他们没有实际运用过SAS、R、Scala、Python或其他计算机语言,他们可能只会像一个“绣花枕头”,中看不中用。
他们必须能够利用工具来阐释和转化信息流。
8. SAS成瘾者
有些SAS开发人员会把自己包装成数据科学家,但他们不是。数据科学家应该掌握多项技能,对于某个具体的问题,他们可以运用多种不同的系统。而蹩脚的数据科学家在遇到任何问题时,都只会采用同一种技能,他们希望用一种语言就能解决所有问题,这是不切实际的。
9. 没有理科学位
这是个不好的迹象,因为数据科学属于理科范畴。你也可能自学成才,但如果有人能秉持科学原则,并且掌握了分析学的一般性应用,还毕业于名牌大学,此人更有可能给企业带来价值。最好能拥有硕士学位。如果在其他领域还拥有一技之长,此人将是一只潜力股。
10. 不会用通俗语言来解释
数据科学家应该能用通俗易懂的日常用语来解释最复杂的问题,不能与现实世界脱节,这会导致你的解决方案无法被人理解,而且你需要花费一定的时间和精力来克服语言障碍。
虽然有很多重要的数据科学技能可以后天习得,但有些却是天生的。那些妨碍你进入数据科学领域的因素常常无法改变或纠正。对数据科学的热情以及掌握一定的技能,这是成功的关键。如果你只是假装有兴趣,或者并不具备重要的技能,总有一天,你会原形毕露。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在实验检测、质量控制、科研验证等场景中,“方法验证”是确保检测/分析结果可靠、可复用的核心环节——无论是新开发的检测方法 ...
2026-03-04在数据分析、科研实验、办公统计等场景中,我们常常需要对比两组数据的整体差异——比如两种营销策略的销售额差异、两种实验方案 ...
2026-03-04在数字化转型进入深水区的今天,企业对数据的依赖程度日益加深,而数据治理体系则是企业实现数据规范化、高质量化、价值化的核心 ...
2026-03-04在深度学习,尤其是卷积神经网络(CNN)的实操中,转置卷积(Transposed Convolution)是一个高频应用的操作——它核心用于实现 ...
2026-03-03在日常办公、数据分析、金融理财、科研统计等场景中,我们经常需要计算“平均值”来概括一组数据的整体水平——比如计算月度平均 ...
2026-03-03在数字化转型的浪潮中,数据已成为企业最核心的战略资产,而数据治理则是激活这份资产价值的前提——没有规范、高质量的数据治理 ...
2026-03-03在Excel办公中,数据透视表是汇总、分析繁杂数据的核心工具,我们常常通过它快速得到销售额汇总、人员统计、业绩分析等关键结果 ...
2026-03-02在日常办公和数据分析中,我们常常需要探究两个或多个数据之间的关联关系——比如销售额与广告投入是否正相关、员工出勤率与绩效 ...
2026-03-02在数字化运营中,时间序列数据是CDA(Certified Data Analyst)数据分析师最常接触的数据类型之一——每日的营收、每小时的用户 ...
2026-03-02在日常办公中,数据透视表是Excel、WPS等表格工具中最常用的数据分析利器——它能快速汇总繁杂数据、挖掘数据关联、生成直观报表 ...
2026-02-28有限元法(Finite Element Method, FEM)作为工程数值模拟的核心工具,已广泛应用于机械制造、航空航天、土木工程、生物医学等多 ...
2026-02-28在数字化时代,“以用户为中心”已成为企业运营的核心逻辑,而用户画像则是企业读懂用户、精准服务用户的关键载体。CDA(Certifi ...
2026-02-28在Python面向对象编程(OOP)中,类方法是构建模块化、可复用代码的核心载体,也是实现封装、继承、多态特性的关键工具。无论是 ...
2026-02-27在MySQL数据库优化中,索引是提升查询效率的核心手段—— 面对千万级、亿级数据量,合理创建索引能将查询时间从秒级压缩到毫秒级 ...
2026-02-27在数字化时代,企业积累的海量数据如同散落的珍珠,若缺乏有效的梳理与分类,终将难以发挥实际价值。CDA(Certified Data Analys ...
2026-02-27在问卷调研中,我们常遇到这样的场景:针对同一批调查对象,在不同时间点(如干预前、干预后、随访期)发放相同或相似的问卷,收 ...
2026-02-26在销售管理的实操场景中,“销售机会”是核心抓手—— 从潜在客户接触到最终成交,每一个环节都藏着业绩增长的关键,也暗藏着客 ...
2026-02-26在CDA数据分析师的日常工作中,数据提取、整理、加工是所有分析工作的起点,而“创建表”与“创建视图”,则是数据库操作中最基 ...
2026-02-26在机器学习分析、数据决策的全流程中,“数据质量决定分析价值”早已成为行业共识—— 正如我们此前在运用机器学习进行分析时强 ...
2026-02-25在数字化时代,数据已成为企业决策、行业升级的核心资产,但海量杂乱的原始数据本身不具备价值—— 只有通过科学的分析方法,挖 ...
2026-02-25