京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据与人才的发现评价_数据分析师
马云说,当我们还没有弄清什么是个人计算机的时候,互联网就来了;当我们还没有弄清什么是互联网的时候,大数据就来了。世界变化太快,以至难以追赶。那么,对于人才工作者来说,应该采取怎样的行动呢?笔者认为,就是一定要善于学习,学习如何在大数据云图下思考,在大数据条件下工作,开拓人才工作的新局面。
目前,对于什么叫大数据,以及大到什么程度才叫大数据,数据科学家的认识还未统一。有一种意见认为,在不同的领域应该有所不同。但是,大数据有几个特征是明显的:一是“非样本”而是全部,二是“非结构”且组成复杂,三是时时刻刻变动不息。按照这样一种精神来观察人才工作,笔者认为是可以在以下三方面,对人才发现评价方面有所推进。
筛选发现人才
全世界每天都有大量学术论文发表,因此,把他们集中起来分类录入就不是一件难事。为了从中选拔出优异者,可以让同行专家投票,也可以采取别的替代方法。于是,美国科学家想到了“科学论文引用率”。就是考察科学论文被他人引用的状况,又叫作“引用指数法”。这个方法的产生与持续,确实帮助世界科学界筛选评价出不少杰出科学家,因此风行至今。
海量的论文,到底哪一篇创新性强、学术影响大?把它找出来,并不是一件容易之事,人们动脑筋把这个问题解决了。论文引用这个事情虽然近期遭到一些诟病,但并非方法本身,而是操作问题。就方法而言,还是科学可行的。
最近,国际知名的汤森路透公司,就是利用这种方法准确筛选而发现诺贝尔奖花落谁家的。汤森路透的专家说,他们的方法就是凭借大数据。只要打开汤森路透公司的网站,你就可以看到不少各种各样的人才排行榜,分专业、分行业,分区域,分国家。
选出各行各业的优秀人才,并且将他们按照一定的规则排队,是一件意义重大的事情,是人才工作领导部门的一项基本功。例如,通过它可以帮助我们找到有限资金的资助重点,而不至于“到处撒一些胡椒面”,不仅能够提升资金的使用效率,而且避免了人情关系。
汤森路透公司称,利用大数据方法,他们成功预测也就是发现了去年的8位诺贝尔奖获得者,准确率高达8/11,也就是72.7%。
比较锁定人才
在美国,不少人喜欢看棒球。如何组织好一支棒球队就成为一种学问。比利·比恩是一位棒球队的经理,自然常常思考这个问题。一般经理寻找优秀球员都依靠猎头公司,他则不然,他是找来一位统计学家前来帮忙,而且尽量将球员的各种能力数据化,并以此作为衡量球员的唯一标准。
可以想到,不同的棒球经理对于什么叫“优秀”都有自己的独特理解。比利·比恩则通过他与统计学家共同研制的这套计算机程序和数学模型,专门寻找那些实际价值被低估了的球员,目的是实现最高的“投入产出比”。这么一来,他做到了以有限的投资,寻找最适宜的人才,终于创下了美国历史上职业棒球大联盟连胜20场的空前纪录。
大数据专家认为,比利·比恩是靠胜人一筹的人才评价软件提升了找寻精度,打败众猎头而以智取胜的。可见,就是依靠同一种原理方法,也有评价技术与思路的高低优劣之分。
排序评价人才
大数据特别重视事物的相关性。这种相关,可能距离较远,也可能距离较近。最近面世的两本新书《唐诗排行榜》与《宋词排行榜》,我认为就是利用了大数据原理而实现诗歌排行的新尝试。虽然书名叫作诗词的排行榜,实际上,也对诗家、词家做出了排队。
众所周知,对于唐诗宋词,人各有爱。有人喜欢李白的浪漫,有人热爱杜甫的现实;有人称赞辛弃疾的豪放慷慨,有人偏爱李清照的婉约多情。也就是说,诗词界没有最高法院,不好评论高低上下。但是,从古至今,人们不住地吟诵评论,总有一个名次之分把?于是有人开始采用新的数学统计方法进行研究,以上两本专著就是凭借方法创新实现的产品创新。
评价者采用了四个方面的数据:历代选本入选唐诗的数据、历代点评唐诗的数据、20世纪研究唐诗论文的数据,以及文学史著作选介唐诗的数据。此外,还参考了网络连接的唐诗数据。数据采集后,研究者进行了加权处理以及标准化处理,通过数学变换消除各项指标量纲的差异。这么一来,就可以得到一个计算公式,而后通过计算机自动计算出每首诗的综合得分。这样,位居前一百名的唐诗名篇就排列出来了。结果,高居榜首的是崔颢的《黄鹤楼》。第二至第五名分别为王维的《送元二使安西》,王之涣的《凉州词(黄河远上)》,王之涣的《登鹳雀楼》,杜甫《登岳阳楼》。前10名内出现了柳宗元、孟浩然、常健、王勃、李白的名篇。但是,如果全面仔细观察,在这100首唐诗之内,按出现的诗歌篇数排队,杜甫、王维和李白高居前三。
这告诉我们,按最负盛名的诗歌排队,崔浩、王维、王之涣依次排列,但按照最负盛名的诗人排队,却成了杜甫、王维、李白遥遥领先。本来是要排行唐诗的,一转身,诗歌创作人才的排行也自然呈现出来了,这是因为二者具有很高的相关性。我想说的是,这种排序方法,对于各行各业的人才发现评价具有相当的启发意义。
结语:人才发现与评价的方法途径大致有三:成果鉴定法、同行认可法、大数据法。以上我们是从大数据思维的角度,对人才发现评价进行了一些初步探讨。限于对大数据的理解不够,很可能没有把问题讲清楚。但是,我们从中能够感受到的是,运用大数据方法发现评价人才,需要的是三种能力:计算机云计算技术能力,数据收集与挖掘能力,还有实施人才管理能力。三种能力密切配合方能发挥作用,达到目的。人才发现与人才评价是既一分为二又合二为一的。只有发现了人才,才能实施评价,而发现者又总是具有一定衡量标准的。社会生活实际中,人才是有“潜显”之分,能够通过不同方法发现“潜人才”,才是可贵的真本事。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-15在数字化时代,企业的每一次业务优化、每一项技术迭代,都需要回答一个核心问题:这个动作到底能带来多少价值?是提升了用户转化 ...
2026-05-15在数据仓库建设中,事实表与维度表是两大核心组件,二者相互关联、缺一不可,共同构成数据仓库的基础架构。事实表聚焦“发生了什 ...
2026-05-15 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-05-15【核心关键词】互联网、机会、运营、关键词、账户、数字化、后台、客户、成本、网络、数据分析、底层逻辑、市场推广、数据反馈 ...
2026-05-14在Python数据分析中,Pandas作为核心工具库,凭借简洁高效的数据处理能力,成为数据分析从业者的必备技能。其中,基于两列(或多 ...
2026-05-14 很多人把统计学理解为“一堆公式和计算”,却忽略了它的本质——一门让数据“开口说话”的科学。真正的数据分析高手,不是会 ...
2026-05-14在零售行业存量竞争日趋激烈的当下,客户流失已成为侵蚀企业利润的“隐形杀手”——据行业数据显示,零售企业平均客户流失率高达 ...
2026-05-13当流量红利消退、用户需求日趋多元,“凭经验决策、广撒网投放”的传统营销模式早已难以为继。大数据的崛起,为企业营销提供了全 ...
2026-05-13 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-05-13在手游行业存量竞争日趋激烈、流量成本持续高企的当下,“拉新”早已不是行业核心痛点,“留存”尤其是“付费留存”,成为决定手 ...
2026-05-12 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-05-12用户调研是企业洞察客户需求、优化产品服务、制定运营策略的核心前提,而调研数据的可靠性,直接决定了决策的科学性与有效性。在 ...
2026-05-11在市场竞争日趋激烈、流量成本持续攀升的今天,企业的核心竞争力已从“获取流量”转向“挖掘客户价值”。客户作为企业最宝贵的资 ...
2026-05-11 很多数据分析师精通Excel单元格操作,熟练应用多种公式,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质 ...
2026-05-11在互联网运营、产品优化、用户增长等领域,次日留存率是衡量产品价值、用户粘性与运营效果的核心指标,更是判断新用户是否认可产 ...
2026-05-09相关性分析是数据分析领域中用于探究两个或多个变量之间关联强度与方向的核心方法,广泛应用于科研探索、商业决策、医疗研究、社 ...
2026-05-09 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-05-09在数据驱动运营的时代,指标是连接业务目标与实际行动的核心桥梁,是企业解读业务现状、发现问题、预判趋势的“量化标尺”。一套 ...
2026-05-08在存量竞争日趋激烈的商业时代,“以客户为中心”早已从口号落地为企业运营的核心逻辑。而客户画像作为打通“了解客户”与“服务 ...
2026-05-08