京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据应用于人力 预测性劳动力分析真的有用么
最近,人力资源专家、人力资源技术会议之父—Bill Kutik写了一篇文章《预测分析炒作》。在这篇文章中,他引用星座研究分析师Holger Mueller的说辞“这归结于当应用于大量有着不同数据视野的顾客时,这些模型是否真的有用。”
因此,当许多人力资源软件供应商光说说要预测“雇员离职风险”时,他们有多少人可以证明他们能说到做到以及他们的预测真的有用,你怎么能确保一个供应商所宣称的可以预测员工留任风险是有效的?你应当寻找什么?
自从2009年的经济衰退巅峰以来,美国每个职业空缺所对应的失业人口数量在稳定的下降,现在已经回到了衰退前的水平。再加上,美国劳工部的统计数据显示,企业不仅越来越难招到人,也越来越难留住人才。
因此,员工保留自然而然成为了大多数人力资源部门的关键任务。为了可以量化人员损耗的影响,许多人尝试把离职和商业影响联系起来。一份分析了48个独立研究的综合性研究中表明,离职真的对财务业绩、客户服务、劳动生产率和安全产出有影响。
更多的人尝试去通过估计直接成本和间接成本来量化离职的的影响。尽管分享了许多的观点,这个研究结果中关于成本和人员损耗的联系仍然有很大程度上的不同。因为考虑到的因素和作用也是多样化的。一个完整的核算需要超越雇佣和培训的范畴,包括分离,生产力和失去的知识。
在一个有着5000名免付加班费员工(例如,行政管理人员,经理主管人员,专业性的员工,计算机专业人员以及销售人员)的公司,有着10%的自愿离职流动率(比2014年行业中的额平均自愿离职率少了超过1%),尽管保守估计每年不必要的离职率可以转化为3000万美元的替代成本。
盈亏的底线可以被好的开支计划所改变,但是滥用的保留员工策略,例如,人力资源或者是经理们用来防止辞职所采用的方法:加薪,奖金或者是升职。当这些策略没有硬数据来支撑他们的话,结果将会十分有限,更糟糕的是,这些钱可能不必要的被用来挽留那些实际上并没有离职风险的人。36大数据
正如在文章中描述的那样,ConAGra食品公司创建了一个人力资源分析程序,使用数据来引导挽留策略的实施显示出了“地毯式轰炸和激光制导弹的区别”。人力资源将它的注意力聚焦并将钱花费到最有用的地方,而不是在整个公司采用挽留策略。如果你可以使用预测分析来准确的识别那些有离职风险的员工,尤其是表现出色的员工以及是关键角色的人,那么你就可以在保证生产力和绩效提升的同时,避免这些成本。在这种情况下,关键字是正确的。
首先,使用任何的预测模型,你需要有一种方法来证明你的预测是有效的。维西尔的数据科学家认定,一个分析若要有效,最少需要分析2至3年的数据(越多越好),它就像在某一时刻,父母对他们的孩子说的那样“你不去试一下,你怎么知道你不喜欢它呢?”或者在我们这一情形下,如果你没有做一个对于真实结果来说有效的预测,你怎么就知道这一预测是有用的呢?
第二,人们做决策的模式不能被归结为市场营销人员这么多年以来一直尝试去发掘的简单因素。它是“有着情感的数据”,并且为了发掘其内在模式需要去展搜寻尽可能多种类的信息来源。就像淘金一样,你搜索的范围越广,你越有可能找到隐藏的金块,也就像预测分析的洞察力一样。
第三,预测的准确性取决于用来建造模型的数据,例如,如果一个模型是基于一个公司的内在因素建立的,那么它就不一定适用于第二个公司。更具挑战的是,在同一个公司的一年和下一年相比之下,对于同一个模型也会同样发生上述情形。使用的方法应该考虑到这一动态性。
问题是如今大多数的“离职风险”预测分析能力都是在他们的初级阶段—他们都没有使用足够的数据来源在足够长的时间中被足够多的公司使用到足够多的员工身上。
验证一个“离职风险”预测分析技术
在维西尔,我们希望把我们自己的“离职风险”预测分析进行测试,为了做这个测试,我们把我们所有所知的关于预测分析的情况和匿名的数据放到我们的云平台上,一步一步的应用我们的“离职风险”预测分析技术。在做这的时候,我们发现维西尔在预测谁会在接下来的三个月中辞职时比猜测和直觉要精确8倍,如果你关注前100名有“离职风险”的员工时,会精确10倍。
通过在员工身上应用一段时间我们的机器学习,我们可以赋值一个“离职风险”分数并将它们从高到低进行排列。这些计算都是动态和即时的,因此当一个人力资源分析师,商业伙伴或者领导询问在一个特别的员工子群体(例如,指定了一个角色、情景、任期以及绩效水平)中谁有“离职风险”时,系统会基于最近适用于用户的数据自动的提供相关结果。
手里持有这些信息,人力资源可以采取行动来应对最脆弱的群体或者是那些准备离职的人。36大数据
尽管有炒作的嫌疑,预测分析将不会取代人类的干预:他们将不会告诉你一个清晰的行动方案,尤其是在处理那些有情感的数据时。
预测分析比关于谁将离职所包含的东西更多,它还包括为什么他们要离职。在许多放面,预测为什么离职比指名某个人更加有价值,因为它通过直击原因的根源来使人力资源采取深切的、精准的,长期的行动来降低离职率。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09