京公网安备 11010802034615号
经营许可证编号:京B2-20210330
走出大数据的“大”的误区,大数据不在数据之大
“大数据”已经成为21世纪商业的代名词。聚拢大量数据的浪潮正变得愈加猛烈。公司无论所属行业和规模大小,都竭力想要实现招聘自动化,将流程数字化,并且打造出客户和求职者的信息库。企业管理层必须面对的问题不在于收集了多少数据,而在于是否拥有恰当的数据,以及如何解读这些数据。
大数据太大?
麦克斯维尔·韦塞尔(Maxwell Wessel)在《哈佛商业评论》的一篇文章中说,我们用来捕捉信息的网正一天天地越铺越大。可能影响到招聘或管理劳动力的所有因素似乎都被一网打尽。
“利用大量的社会、天气和政府数据预测供应链中断。”韦塞尔写道,“利用大量的用户数据在汪洋般的网站点击中识别个人用户。企业甚至开始利用海量的文字交流信息来开发能够和客户对话的电脑算法。”
如今,这一切在行业内均有发生,甚至已将人工智能(AI)用作为招聘工具。FirstJob推出了Mya,这款AI系统利用自然语言处理和机器学习,旨在令75%的招聘过程实现自动化。
与亚马逊(Amazon)的Alexa和苹果(Apple)的Siri等虚拟助理一样,Mya也能模拟对话,和用户进行复杂一点的互动。通过这些交流,Mya可以不断收集求职者的数据,比如他们的技能、敬业度、文化契合度等等,然后将这些数据被转换成可量化的情报。
由于Mya才刚刚面世,其效果还有待观察。但问题依旧:在Mya从无数求职者那里收集的大量信息中,有多少是有用的?有多少是可执行的?有多少是多余的?
小而恰当的数据据佳例Uber
尽管毁誉参半,但Uber的确成功展现了数据分析的力量。投资者和商业专家早就把这款按需网约车应用称为大数据的楷模。Uber会从司机和乘客那里收集大量信息,按照韦塞尔的说法,这使它能够规划“人类交通的实时物流”。然而,韦塞尔也指出了Uber数据真实规模的一个关键性的特点。
威塞尔说:“Uber的成功并不在于它收集的大量数据,而是来自截然不同的方向:小而恰当的数据。Uber就是利用这样的数据来调度车辆。”
在Uber急速崛起之前,乘客是靠出租车来实现类似的服务。韦塞尔说,虽然没有电脑收集和处理数据,但“在城市街道上用眼睛搜索潜在乘客”的做法本身就是一种收集和分析数据的大型程序。
“尽管计算发生在人脑内部,但被收集和分析的数据量并没有不同。”他说,“Uber巧妙的解决方案就是不再对视觉数据应用生物异常探测算法,而是利用恰当数据来完成这项任务。谁需要打车?他们在哪里?这些至关重要的信息让Uber、Lyft和滴滴出行等公司彻底改革了一个行业。”
恰当调整你的大数据规模
1识别浪费
想要弄清楚数据的恰当规模,关键是识别“浪费”。韦塞尔以花店为例。普通零售花店的损耗率高达50%,这意味着一半的漂亮花束还没有卖出去就被扔进垃圾箱。不过,浪费却是机遇的一个宝贵来源。
“无论是工业生产、零售还是法律调查,应该弄清楚精力和资源遭到浪费的源头,以此找出迈向恰当数据的方向。”韦塞尔写道。
对于领导层来说,在确定恰当的人才数据时,第一步就是找出浪费掉的精力或者无用的流程。假设你的工作应聘率为1:5或更低,这就意味着你的招聘人员或者招聘合作方收到的简历不够多。于是你就找出了“浪费”的源头和改善流程的机会。
2减少浪费
这时,你决定将重点放在减少浪费上,想办法改变流程,防止精力被浪费或者无效。还是以工作应聘率问题为例,我们需要开始积累、分析和合成与这个问题有关的数据。
职位描述写得怎么样?是否有吸引力?对客户和应聘者双方来说,是否都准确反映了该职位的要求和福利?
是否利用了恰当的招聘渠道?如果传统的招聘渠道效果不好,那就分析社交网络、在线群体、社区、大学系统和其他媒介的数据。也许LinkedIn和Facebook是比全球最大招聘网站Monster更好的招聘渠道。
招聘宣传做得怎么样?这个过程是人工完成的吗?能不能实现自动化?
对比失败的开端或者应聘者寥寥无几的场面,那些成功的招聘工作又是怎么样的?分析这些数据将帮助你从中吸取经验。
3建立有意义的数据集
着眼全局,思考数据如何影响整间公司和所有员工。
防范确认性偏见。像《流言终结者》节目主持人那样进行分析。尝试推翻被广泛接受的标准。敢于承担风险、失败和意外结果。所有这些都是重要的学习经历,将会帮助你改善流程。
利用可靠、有效、干净和完整的数据集。数据应该是客观的,而不是仅仅基于特定的商业团体、人才类别、公司部门或者招聘经理。
进行跨团体、跨时间的比较。
4立刻让盟友、利益相关者和合作伙伴参与进来
如果利益相关者不知情,没有参与进来,那么即使是考虑最全面、执行最到位的分析也可能失败。让其他人也加入这趟发现之旅,向他们征求意见。你会发现,被赋予了决策权的人往往更愿意参与其中,检查研究结果,了解其价值,落实修改意见。如果忽视这一点,所有努力都可能付之东流。
要是没有事先告知和参与,此过程中的其他利益相关者可能会觉得有人在对自己的工作指手画脚,尤其是在他们认为自己明明做得很好的情况下。尽管另一方面的用意是好的,但被动接受者会觉得自己被蒙在了鼓里。如果发生这样的事情,重要的计划可能却会应者寥寥,得不到落实,这相当于是在浪费机会、时间和金钱。
5创建数据团队
创建恰当的数据团队是必要之举,在收集和分析数据之前就应该着手进行。虽然在项目经理的头脑和追踪系统(比如VMS、ATS、企业资源系统等等)里,存放着堆积如山的有用数据,但必须通过多方协作才能作出周详的决定。最好的数据团队应该具有广泛的代表性。在项目中,应该包含来自客户组织、MSP、VMS和招聘合作公司的专业人士。我们需要这些主题专家来解决项目的“为什么”、“是什么”和“怎么做”。
“为什么”团队:招聘经理、运营主管和公司高管,他们提供商业技能。
“是什么”团队:招聘合作方、采购主管和人事专员,他们提供人力资源方面的技能。
“怎么做”团队:来自临时工企业、客户单位和技术提供商(比如VMS)的数据分析专家,他们知道如何收集信息,如何把信息转换成有意义的结论供决策者参考。
更为重要的是,确保数据团队体现多样化的想法和观点。很多企业认为自己是数据驱动型企业,重度依赖收集自多个信息源的信息,比如客户、员工、供应商等。但如果数据团队成员有太多的共同点(比如来自同一个部门),那么他们对数据的解读常常会带有偏见、过于简单、过于宽泛或者倾向于证明一个假设,而不是揭示一项事实。
再以工作应聘率为例。如果负责收集数据的人同时也是寻找或招聘求职者的人,那么他们最终会陷入防御心态。在这种情况下,他们往往会寻找数据来为他们的挫折辩护。或者,他们过度纠结于应该检查应聘者的哪些方面。而如果数据团队成员来自人力资源、营销、运营和招聘合作方等多种立场呢?引入临时工项目其他方面的利益相关者后,你会更加清楚地知道问题所在,找到解决办法。
找到恰当数据的“甜区”
韦塞尔在文章中写道:“恰当数据有时很大,有时很小。但对创新者来说,关键是弄明白哪些是能够提升竞争力的关键性数据。这些数据就是你应该积极探寻的恰当数据。”
关于项目(无论大小)的数据能把我们以前从来不知道的优秀人才和创新者呈现在我们眼前。我们只需要确保自己看向恰当的地方,翻开恰当的石头。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15