京公网安备 11010802034615号
经营许可证编号:京B2-20210330
你out了没?用大数据组建超级团队
当“球探”遇上大数据会产生什么样的化学反应?美国奥克兰市运动家棒球队,曾因采用数学模型来预测球员成绩、遴选球员而大面积改变了球队成绩,创造了美国棒球联赛史上最长的连续获胜记录。《大西洋月刊》编辑Don Peck 特别报道《HR遭遇大数据:他们在盯着你工作》中,描述了数据分析对于职场人力资源工作带来的变革。
比利·比恩(Billy Beane)曾是奥克兰市运动家棒球队的总经理。2003年,拜美国作家迈克尔·刘易斯(Michael Lewis)和他的畅销书《魔球——逆境中致胜的智慧》(Moneyball: Art of Winning an Unfair Game )所赐,比恩先生成了明星。
时间往前推一年,比恩在例行为俱乐部挑选球员时,一改过去依赖“球探”帮助的办法,他将搜罗球员的决策托付给了“数学模型”——等等,什么样的模型?比恩采用的模型由一位毕业于哈佛大学的年轻统计学天才开发,专门供比恩和他的下属使用。
这之后不久,奥克兰运动家队就书写了棒球赛史上的传奇。这支小众的球队凭着微不足道的预算横扫赛场,创造了美国棒球联赛史上最长的连续获胜记录,一个赛季就收获了103场胜利。如此胜绩只有老牌劲旅扬基队才能比肩,可扬基队的队员薪水足足是奥克兰运动家队球员的三倍。
比恩的球队成绩斐然,由此在职业棒球界掀起了一场革命。此后,越来越多的球队开始运用预测模型评估球员的潜力和市场价值,而那些先行一步的球队大体上都赢得了显著的竞争优势,明显胜过比他们更保守的同行。
表面上,这本书讲述的不过是一支棒球队令人难忘的励志传奇,但它实际上佐证了一个趋势:在就业招聘这件事儿上的相关研究已经有新路子了——预测性的统计分析和大数据应用,将有望改变招聘、评估数百万就业者的方式。
你可曾想过,像这样用大数据来预测、分析、组建你需要的一支牛逼团队?没错,你会说大数据这个词都快被各种行业和媒体说的无聊了,但我们还是不可避免要提到了它,为了表达原有格局即将瓦解时,它似乎再合适不过了。
技术的发展,已经让定期获取人类的行为信息成为可能,这类信息涉及的范围更广,也更有深度,还能对这些信息进行新型的分析。目前,全世界范围内98%以上的信息都已经采用数字化存储方式。2007年以来,整体数据量已经翻了四倍。
普通人不论在家中还是在工作时都会产生大量这类数据,比如发送电子邮件、浏览因特网、使用社交媒体、从事众包项目以及更多的其他活动。在产生数据时,他们无形中就在为发起一个全新的社会项目起到帮助。《大数据时代:生活、工作与思维的大变革》一书的两位作者维克托·迈尔-舍恩伯格和肯尼思·库克耶就指出,
“我们正身处一个了不起的基础设施项目中。在某些方面,它甚至可以同过去古罗马人的水利沟渠和文艺复兴时期的百科全书媲美。这个项目就是‘数据化’,和其他基础设施的进步一样,它也会使这个社会发生本质变化。”
在我们所处的时代,各个行业的变化已经发生了,预测股价走势的电脑程式算法改变了华尔街,精准分析互联网浏览记录的算法已改变了市场营销的传统方式。但一直少有人相信,类似的数据驱动的方式可能广泛应用于人才市场。
这种方式却真真实实的已经成为HR们在使用的工具。美国康奈尔大学工业与劳动关系学院教授约翰·豪斯克内西特曾对媒体表示,近年来,美国国内“劳动者分析职位需求大幅增长”。为配合劳动力市场供需的最新形势,豪斯克内西特先生把自己主讲的科目也修改了教学课程。
如今,我们不但能在谷歌、惠普、英特尔、通用汽车和宝洁这样的业界大牌公司找到HR部门专职的分析团队,还能在一些新生代公司发现他们的身影,如美国甜点品牌Little Debbie蛋糕的田纳西州生产商McKee Foods。连比利·比恩也赶上这个潮流,去年他出席了德克萨斯州奥斯汀的一次企业人力资源高管大会,发表了一场题为“新时代人才管理的点球成金术”(The Moneyball Approach to Talent Management),由此在行业内出尽风头,他的演讲也被媒体稍作修改,发表在所有关于HR行业的各大刊物上。
对于职场人来说,在职业生涯分析中引用“预测分析法”还是一个新兴领域,将它称为“人本分析”( people analytics)或许更贴切。当然,把理论应用到实际工作中挑战很大,更别提还存在道德方面的争议了!似乎是令人望而生畏。达到预测的目的,就必须针对“个人表现”(如业绩、工作态度、KPI之类的内容)创建庞大的个人技术统计表,比我们在体育运动网页上见过的所有表格规模都要大,也超乎我们此前的一切想象。
某种程度上讲,这种分析和统计应用在实际中,本质上就是在探查人性最深处隐藏的秘密,甚至涉及我们怎样成长、是否会繁衍后代、长大成人后是什么模样。
所以,大部分相关领域的公司只是刚开始探索应用的可能性。今后五到十年间,数据分析行业会诞生新的模型,并且会进行极大规模的新实验。这对经济体、对我们的职业道路、精神面貌和自我价值感来说,算不算可喜的进展?
打从“公司”这个概念诞生其,这个世界上就出现了一种叫做“经理人”的人物,每天都致力于辨别哪些人最适合做他们的手下,而选拔人才的技巧也是千差万别。
说个有趣的历史:上世纪之初,美国费城的一家制造商招工时想出了一个怪招决定人选:命令工头站在工厂门口,向那些围在工头四周的求职者抛出苹果,如果有人动作够快,能接到苹果,而且身强力壮,能保住接到的苹果,工厂就录用。
那个时代的观念,的确跟现在截然不同——一种“达尔文进化论”流程成为某些精英管理者头脑中主流的指导思想(当然没有自然界的进化论那么血腥)。彼时,美国钢铁公司、杜邦和通用电气这类那个时代冉冉升起的巨头正在进行整合,动辄影响整个行业。大鱼吃小鱼式的整合摧毁了弱小的竞争对手,催生了更强大的企业,他们的创始人通常会获得业界巨头青睐,得到那些企业的高层职位。这种方式运转的非常顺利。正如沃顿商学院教授彼得·卡普利(Peter Cappelli)在论著中所写的,“在预测和甄选的科学领域,没有什么方式的影响力能比得上观察人们的实际表现。”
然而,到了二战末期,美国人才供求市场却出现了严重的人才短缺状况。企业的高层管理人员年纪渐长,而从30年代大萧条直到二战期间,由于招聘就业市场疲软,已经导致训练有素的能干经理人短缺。在普通员工中寻找有潜力迅速成长的“璞玉”,便成为美国商界的当务之急。
由此开始,企业开始涉及一套正式的招聘与管理系统。怎么建立系统?部分是依据人类行为学的最新研究成果,部分源于两次大战期间开发的军用技巧。因为爆发世界大战时需要大批调动军队,并且出现大量伤亡,需要尽可能高效地用人,尽量做到人尽其才。截至上世纪50年代,对那些应聘专业岗位的年轻人,最常见的做法就是花上好几天,让他们参加一整套“测试”。这些企业都期望能在求职者之中挖掘日后能晋升管理层的潜力股。1950年的一期《商业周刊》指出:“宝洁公司会直接从大专院校挑选高管人才”。
毫无疑问,那是一个带有技术官僚习气的盲目的时代。你想想,从IQ测试、数学测试、词汇测试、专业态度测试、职业兴趣测试、罗夏克(Rorschach)人格测试到其他一系列性格评估,甚至体检,招聘也如流水作业一般。早期,大公司通过种种测试让应聘者接受考验,希望用测试来决定合适的人选。
哪怕员工已经选好开始工作了,评估过程也没有结束。商业报道记者威廉·怀特(William Whyte)在自己1956年发表的经典文化批评名作《组织人》中透露,约四分之一的美国企业都在使用相似的测试评估经理和初级管理者,常用于评估这些管理者是否准备好胜任更高的职位。怀特在书中写道:“是应该提拔琼斯,还是搁置不用?过去,这名员工的主管们为了拿主意不得不相互讨论这个问题,如今他们可以和心理学家一起调查,看心理测试的结果怎么说。”
然而,这种上世纪中叶在企业界风靡一时的方式到了1990年几乎销声匿迹。彼得·卡普利告诉我:“我认为,要是目睹现在的企业这么随意地招聘,上世纪70年代末的人力资源从业者会感到震惊。” 也就是说,到了90年代,企业不再用几天时间做测试,而是办几场临时的面试,只是随性地想些问题提问应试者。这个改变是为什么?
卡普利说,有很多原因可以解释这种变化。他列举了不少,比如跳槽现象增多、使企业没那么必要做彻底的测试,那样测试也显得不够经济实用;企业更注重短期财务盈利,因而削弱了企业仅为长远发展孕育人才的内在功能;另外,1964年出台的《人权法案》(The Civil Rights Act)让一些进行有歧视倾向招聘的公司要承担法律责任,这也令企业的人力资源部门担心,大范围采用任何成绩明确的测试都可能日后表露系统性的偏好。正是由于种种因素影响,企业开始青睐没那么正式的量化招聘方式。这种做法至今仍然很有市场。
但企业放弃自己当初锋芒毕露的方式还有一个理由:他们使用的许多评估法后来证明并没有那么科学。有些方法的依据是从未测试过的心理学理论。还有些最初是为评估精神疾病而设计的,有时接受测试的又是人数相对较少的不具代表性人群,如大学新生,所以那些测试结果只能显示出,测试对象的反应尚属“正常”。威廉·怀特主持了一些面向企业总裁的测试,发现没有哪位总裁的评分属于招聘“可接纳”的范畴。
怀特的结论是,这类评估并未评估潜能,只能简单地评价是否从大流。其中一些测试也很不注重隐私权,比如会询问测试对象的个人习惯或者父母的情感。因此,接受测试者对如此不人性化的探究和刺激(有时就是赤裸裸地触痛对方)反感也就不足为怪了。
基于上述原因及其他方面因素,“招聘是门科学”的观点已经受到冷落。而如今,它的地位正失而复得,这要归功于分析的新技术和新方法,它们让我们过去的分析手段成本更低、速度更快、覆盖范围更广。无论好坏,科技创造可能性的新时代已拉开帷幕。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27