
大数据应用于人力 预测性劳动力分析真的有用么
最近,人力资源专家、人力资源技术会议之父—Bill Kutik写了一篇文章《预测分析炒作》。在这篇文章中,他引用星座研究分析师Holger Mueller的说辞“这归结于当应用于大量有着不同数据视野的顾客时,这些模型是否真的有用。”
因此,当许多人力资源软件供应商光说说要预测“雇员离职风险”时,他们有多少人可以证明他们能说到做到以及他们的预测真的有用,你怎么能确保一个供应商所宣称的可以预测员工留任风险是有效的?你应当寻找什么?
自从2009年的经济衰退巅峰以来,美国每个职业空缺所对应的失业人口数量在稳定的下降,现在已经回到了衰退前的水平。再加上,美国劳工部的统计数据显示,企业不仅越来越难招到人,也越来越难留住人才。
因此,员工保留自然而然成为了大多数人力资源部门的关键任务。为了可以量化人员损耗的影响,许多人尝试把离职和商业影响联系起来。一份分析了48个独立研究的综合性研究中表明,离职真的对财务业绩、客户服务、劳动生产率和安全产出有影响。
更多的人尝试去通过估计直接成本和间接成本来量化离职的的影响。尽管分享了许多的观点,这个研究结果中关于成本和人员损耗的联系仍然有很大程度上的不同。因为考虑到的因素和作用也是多样化的。一个完整的核算需要超越雇佣和培训的范畴,包括分离,生产力和失去的知识。
在一个有着5000名免付加班费员工(例如,行政管理人员,经理主管人员,专业性的员工,计算机专业人员以及销售人员)的公司,有着10%的自愿离职流动率(比2014年行业中的额平均自愿离职率少了超过1%),尽管保守估计每年不必要的离职率可以转化为3000万美元的替代成本。
盈亏的底线可以被好的开支计划所改变,但是滥用的保留员工策略,例如,人力资源或者是经理们用来防止辞职所采用的方法:加薪,奖金或者是升职。当这些策略没有硬数据来支撑他们的话,结果将会十分有限,更糟糕的是,这些钱可能不必要的被用来挽留那些实际上并没有离职风险的人。36大数据
正如在文章中描述的那样,ConAGra食品公司创建了一个人力资源分析程序,使用数据来引导挽留策略的实施显示出了“地毯式轰炸和激光制导弹的区别”。人力资源将它的注意力聚焦并将钱花费到最有用的地方,而不是在整个公司采用挽留策略。如果你可以使用预测分析来准确的识别那些有离职风险的员工,尤其是表现出色的员工以及是关键角色的人,那么你就可以在保证生产力和绩效提升的同时,避免这些成本。在这种情况下,关键字是正确的。
首先,使用任何的预测模型,你需要有一种方法来证明你的预测是有效的。维西尔的数据科学家认定,一个分析若要有效,最少需要分析2至3年的数据(越多越好),它就像在某一时刻,父母对他们的孩子说的那样“你不去试一下,你怎么知道你不喜欢它呢?”或者在我们这一情形下,如果你没有做一个对于真实结果来说有效的预测,你怎么就知道这一预测是有用的呢?
第二,人们做决策的模式不能被归结为市场营销人员这么多年以来一直尝试去发掘的简单因素。它是“有着情感的数据”,并且为了发掘其内在模式需要去展搜寻尽可能多种类的信息来源。就像淘金一样,你搜索的范围越广,你越有可能找到隐藏的金块,也就像预测分析的洞察力一样。
第三,预测的准确性取决于用来建造模型的数据,例如,如果一个模型是基于一个公司的内在因素建立的,那么它就不一定适用于第二个公司。更具挑战的是,在同一个公司的一年和下一年相比之下,对于同一个模型也会同样发生上述情形。使用的方法应该考虑到这一动态性。
问题是如今大多数的“离职风险”预测分析能力都是在他们的初级阶段—他们都没有使用足够的数据来源在足够长的时间中被足够多的公司使用到足够多的员工身上。
验证一个“离职风险”预测分析技术
在维西尔,我们希望把我们自己的“离职风险”预测分析进行测试,为了做这个测试,我们把我们所有所知的关于预测分析的情况和匿名的数据放到我们的云平台上,一步一步的应用我们的“离职风险”预测分析技术。在做这的时候,我们发现维西尔在预测谁会在接下来的三个月中辞职时比猜测和直觉要精确8倍,如果你关注前100名有“离职风险”的员工时,会精确10倍。
通过在员工身上应用一段时间我们的机器学习,我们可以赋值一个“离职风险”分数并将它们从高到低进行排列。这些计算都是动态和即时的,因此当一个人力资源分析师,商业伙伴或者领导询问在一个特别的员工子群体(例如,指定了一个角色、情景、任期以及绩效水平)中谁有“离职风险”时,系统会基于最近适用于用户的数据自动的提供相关结果。
手里持有这些信息,人力资源可以采取行动来应对最脆弱的群体或者是那些准备离职的人。36大数据
尽管有炒作的嫌疑,预测分析将不会取代人类的干预:他们将不会告诉你一个清晰的行动方案,尤其是在处理那些有情感的数据时。
预测分析比关于谁将离职所包含的东西更多,它还包括为什么他们要离职。在许多放面,预测为什么离职比指名某个人更加有价值,因为它通过直击原因的根源来使人力资源采取深切的、精准的,长期的行动来降低离职率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15在机器学习入门领域,“鸢尾花数据集(Iris Dataset)” 是理解 “特征值” 与 “目标值” 的最佳案例 —— 它结构清晰、维度适 ...
2025-10-15在数据驱动的业务场景中,零散的指标(如 “GMV”“复购率”)就像 “散落的零件”,无法支撑系统性决策;而科学的指标体系,则 ...
2025-10-15在神经网络模型设计中,“隐藏层层数” 是决定模型能力与效率的核心参数之一 —— 层数过少,模型可能 “欠拟合”(无法捕捉数据 ...
2025-10-14在数字化浪潮中,数据分析师已成为企业 “从数据中挖掘价值” 的核心角色 —— 他们既要能从海量数据中提取有效信息,又要能将分 ...
2025-10-14在企业数据驱动的实践中,“指标混乱” 是最常见的痛点:运营部门说 “复购率 15%”,产品部门说 “复购率 8%”,实则是两者对 ...
2025-10-14在手游行业,“次日留存率” 是衡量一款游戏生死的 “第一道关卡”—— 它不仅反映了玩家对游戏的初始接受度,更直接决定了后续 ...
2025-10-13分库分表,为何而生? 在信息技术发展的早期阶段,数据量相对较小,业务逻辑也较为简单,单库单表的数据库架构就能够满足大多数 ...
2025-10-13在企业数字化转型过程中,“数据孤岛” 是普遍面临的痛点:用户数据散落在 APP 日志、注册系统、客服记录中,订单数据分散在交易 ...
2025-10-13在数字化时代,用户的每一次行为 —— 从电商平台的 “浏览→加购→购买”,到视频 APP 的 “打开→搜索→观看→收藏”,再到银 ...
2025-10-11在机器学习建模流程中,“特征重要性分析” 是连接 “数据” 与 “业务” 的关键桥梁 —— 它不仅能帮我们筛选冗余特征、提升模 ...
2025-10-11在企业的数据体系中,未经分类的数据如同 “杂乱无章的仓库”—— 用户行为日志、订单记录、商品信息混杂存储,CDA(Certified D ...
2025-10-11在 SQL Server 数据库操作中,“数据类型转换” 是高频需求 —— 无论是将字符串格式的日期转为datetime用于筛选,还是将数值转 ...
2025-10-10在科研攻关、工业优化、产品开发中,正交试验(Orthogonal Experiment)因 “用少量试验覆盖多因素多水平组合” 的高效性,成为 ...
2025-10-10在企业数据量从 “GB 级” 迈向 “PB 级” 的过程中,“数据混乱” 的痛点逐渐从 “隐性问题” 变为 “显性瓶颈”:各部门数据口 ...
2025-10-10在深度学习中,“模型如何从错误中学习” 是最关键的问题 —— 而损失函数与反向传播正是回答这一问题的核心技术:损失函数负责 ...
2025-10-09本文将从 “检验本质” 切入,拆解两种方法的核心适用条件、场景边界与实战选择逻辑,结合医学、工业、教育领域的案例,让你明确 ...
2025-10-09在 CDA 数据分析师的日常工作中,常会遇到这样的困惑:某电商平台 11 月 GMV 同比增长 20%,但究竟是 “长期趋势自然增长”,还 ...
2025-10-09Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30