大数据时代 寻找数据科学家
数据科学家已供不应求,这已经不是什么秘密了。数据爆炸以及相应的防爆工具,还有摩尔定律和梅特卡夫定律,他们的连锁影响导致与以往相比有更多的数据、链接、以及技术需要处理。在去年的Hadoop世界中,掀起了一股培养数据科学家的狂潮,他们只能勉强满足相形见绌以技术为导向的数据结构师的需求。这意味着:
1.潜在的MacArthur Grant受助人,他需要对数据、数学和统计学技能的有热情和洞察力,它能够明白运算法则,了解绘画图片的艺术性,并且明白所有数据的导向性。这就是数据科学家的意思。
2.这些人可以了解大数据平台的侧面,也就是数据结构师或者数据工程师。
数据结构师将会是更加直面困难的一方。了解大型的数据平台(Hadoop, MongoDB,
Riak)和新兴的高级SQL产品(Exadata, Netezza, Greenplum, Vertica,
以及最近崛起的一项技术,比如说Calpont),这是一项技术技能,可以通过明确的课程来进行教授。供给和需求的法则将会解决这一问题——就像早在1999年泡沫创造了对Java程序员的需求一样。
在所有需要Hadoop程序员的呼声背后,还有一个类似的,但是非常安静的,人们争先恐后的急于招聘数据科学家的趋势。就像一些数据科学家称数据科学家是一个流行语一样,这种需求是真实存在的。[page]
然而,数据科学将会有很多的困难需要克服。这所有的一切都是与连接点相关的,并不像听起来那么容易。大数据的V——容量,品种,速度和价值——都需要某些人根据对数据的洞察力而有所发现;传统上,该角色是由数据开发人员来完成的。但数据开发人员只能处理好有限的问题,以及有界(已知)的数据集,这使问题更加二维化。
各种各样的大数据——在形式和来源上引进了一种未知的元素。大数据的解读需要进行精明的调查、沟通技巧、创意/艺术,并且还要有对数字非常直觉的思考能力。并且不要忘记这一切都要建立在坚实的统计和机器学习背景,加上对工具和贸易编程语言的技术知识的基础之上。
有时好像我们正在寻找爱因斯坦或某些智者。
自然界讨厌真空
正像自然界讨厌真空一样,现在人们不但急于定义什么样的人是数据科学家,而且也都在考虑开发出一些程序,通过这些程序来进行教学,通过软件包在某些程度上将这些信息包含在里面,否则就将它们扔到其他的地方。EMC和其他厂商正在加紧开发板块来提供培训,不仅仅是在平台上,还要针对数据科学。kaggle提供一种创新性的基于云的,众包方式的数据科学,提供了预测性的建模平台,然后再分段发起24小时的比赛,用于潜在培养数据科学家制定针对特殊问题的最佳的解决方案(这使人联想到Netflix的100万美元的奖金制度,设计出一个更聪明的算法来预测观众的口味)。
随着数据科学的人才奇缺,我们期望顾问公司购买更多的人才,然后可以“租”给多个客户端。除了少数的国外公司之外,很少有系统集成商(SI)已经加紧推出板块,正式推出大数据实践(逻辑数据科学家将驻留的地方),但我们期望这种情况会很快改变。[page]
Opera的解决方案,自2004年以来,它已经参与到了预测性分析咨询的比赛中来,这一方案下一步采用的是下行的包装路线。去年在系列A中增加了8400万美元的资金,该公司已配备了近200个数据科学家,在谷歌的这一边成为了最大的天才组合之一。Opera的预测分析解决方案是专为各种不同的平台设计的,SQL和Hadoop,今天他们加入了SAP Sapphire的宣布潮流中,同时发布了他们对HANA内存数据库的报价。安德鲁?布鲁斯特对本公告的细节进行了很好的深入分析。
从SAP的角度来看,Opera的预测分析解决方案在逻辑上是合适HANA的,因为它们涉及到各种复杂问题(例如,一个计算触发其他计算),其新的内存中的数据库平台是专门为其设计的。
期望Opera继续保持作为唯一的大型聚集数据科学家的公司,这些科学家可供其他的公司租用,这种期望对于Opera公司来说,具有非常大的价值。但具有讽刺意味的是,市场进入壁垒将会使竞争的空间一直非常狭窄并且高度集中。当然,随着市场需求的增加,将不可避免地出现对数据科学家定义的下行态势,这样越来越多的公司就可以声称他们已经得到了一个或许多的数据科学家。
供给和需求的法则将在数据科学家方面出现偏差,但供给的上升速度不会像更加注重平台的数据建筑师或工程师一样迅速。不可避免的,数据科学家的供应将会受到软件的加强,软件可以自动的解释机器学习的内容,但是软件的功能只能仅止于此,你可以在机器上编制具有创造力和反直觉洞察力的程序。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-25在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-24以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《刘静:10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda ...
2025-04-23大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03