
走出大数据的“大”的误区,大数据不在数据之大
“大数据”已经成为21世纪商业的代名词。聚拢大量数据的浪潮正变得愈加猛烈。公司无论所属行业和规模大小,都竭力想要实现招聘自动化,将流程数字化,并且打造出客户和求职者的信息库。企业管理层必须面对的问题不在于收集了多少数据,而在于是否拥有恰当的数据,以及如何解读这些数据。
大数据太大?
麦克斯维尔·韦塞尔(Maxwell Wessel)在《哈佛商业评论》的一篇文章中说,我们用来捕捉信息的网正一天天地越铺越大。可能影响到招聘或管理劳动力的所有因素似乎都被一网打尽。
“利用大量的社会、天气和政府数据预测供应链中断。”韦塞尔写道,“利用大量的用户数据在汪洋般的网站点击中识别个人用户。企业甚至开始利用海量的文字交流信息来开发能够和客户对话的电脑算法。”
如今,这一切在行业内均有发生,甚至已将人工智能(AI)用作为招聘工具。FirstJob推出了Mya,这款AI系统利用自然语言处理和机器学习,旨在令75%的招聘过程实现自动化。
与亚马逊(Amazon)的Alexa和苹果(Apple)的Siri等虚拟助理一样,Mya也能模拟对话,和用户进行复杂一点的互动。通过这些交流,Mya可以不断收集求职者的数据,比如他们的技能、敬业度、文化契合度等等,然后将这些数据被转换成可量化的情报。
由于Mya才刚刚面世,其效果还有待观察。但问题依旧:在Mya从无数求职者那里收集的大量信息中,有多少是有用的?有多少是可执行的?有多少是多余的?
小而恰当的数据据佳例Uber
尽管毁誉参半,但Uber的确成功展现了数据分析的力量。投资者和商业专家早就把这款按需网约车应用称为大数据的楷模。Uber会从司机和乘客那里收集大量信息,按照韦塞尔的说法,这使它能够规划“人类交通的实时物流”。然而,韦塞尔也指出了Uber数据真实规模的一个关键性的特点。
威塞尔说:“Uber的成功并不在于它收集的大量数据,而是来自截然不同的方向:小而恰当的数据。Uber就是利用这样的数据来调度车辆。”
在Uber急速崛起之前,乘客是靠出租车来实现类似的服务。韦塞尔说,虽然没有电脑收集和处理数据,但“在城市街道上用眼睛搜索潜在乘客”的做法本身就是一种收集和分析数据的大型程序。
“尽管计算发生在人脑内部,但被收集和分析的数据量并没有不同。”他说,“Uber巧妙的解决方案就是不再对视觉数据应用生物异常探测算法,而是利用恰当数据来完成这项任务。谁需要打车?他们在哪里?这些至关重要的信息让Uber、Lyft和滴滴出行等公司彻底改革了一个行业。”
恰当调整你的大数据规模
1识别浪费
想要弄清楚数据的恰当规模,关键是识别“浪费”。韦塞尔以花店为例。普通零售花店的损耗率高达50%,这意味着一半的漂亮花束还没有卖出去就被扔进垃圾箱。不过,浪费却是机遇的一个宝贵来源。
“无论是工业生产、零售还是法律调查,应该弄清楚精力和资源遭到浪费的源头,以此找出迈向恰当数据的方向。”韦塞尔写道。
对于领导层来说,在确定恰当的人才数据时,第一步就是找出浪费掉的精力或者无用的流程。假设你的工作应聘率为1:5或更低,这就意味着你的招聘人员或者招聘合作方收到的简历不够多。于是你就找出了“浪费”的源头和改善流程的机会。
2减少浪费
这时,你决定将重点放在减少浪费上,想办法改变流程,防止精力被浪费或者无效。还是以工作应聘率问题为例,我们需要开始积累、分析和合成与这个问题有关的数据。
职位描述写得怎么样?是否有吸引力?对客户和应聘者双方来说,是否都准确反映了该职位的要求和福利?
是否利用了恰当的招聘渠道?如果传统的招聘渠道效果不好,那就分析社交网络、在线群体、社区、大学系统和其他媒介的数据。也许LinkedIn和Facebook是比全球最大招聘网站Monster更好的招聘渠道。
招聘宣传做得怎么样?这个过程是人工完成的吗?能不能实现自动化?
对比失败的开端或者应聘者寥寥无几的场面,那些成功的招聘工作又是怎么样的?分析这些数据将帮助你从中吸取经验。
3建立有意义的数据集
着眼全局,思考数据如何影响整间公司和所有员工。
防范确认性偏见。像《流言终结者》节目主持人那样进行分析。尝试推翻被广泛接受的标准。敢于承担风险、失败和意外结果。所有这些都是重要的学习经历,将会帮助你改善流程。
利用可靠、有效、干净和完整的数据集。数据应该是客观的,而不是仅仅基于特定的商业团体、人才类别、公司部门或者招聘经理。
进行跨团体、跨时间的比较。
4立刻让盟友、利益相关者和合作伙伴参与进来
如果利益相关者不知情,没有参与进来,那么即使是考虑最全面、执行最到位的分析也可能失败。让其他人也加入这趟发现之旅,向他们征求意见。你会发现,被赋予了决策权的人往往更愿意参与其中,检查研究结果,了解其价值,落实修改意见。如果忽视这一点,所有努力都可能付之东流。
要是没有事先告知和参与,此过程中的其他利益相关者可能会觉得有人在对自己的工作指手画脚,尤其是在他们认为自己明明做得很好的情况下。尽管另一方面的用意是好的,但被动接受者会觉得自己被蒙在了鼓里。如果发生这样的事情,重要的计划可能却会应者寥寥,得不到落实,这相当于是在浪费机会、时间和金钱。
5创建数据团队
创建恰当的数据团队是必要之举,在收集和分析数据之前就应该着手进行。虽然在项目经理的头脑和追踪系统(比如VMS、ATS、企业资源系统等等)里,存放着堆积如山的有用数据,但必须通过多方协作才能作出周详的决定。最好的数据团队应该具有广泛的代表性。在项目中,应该包含来自客户组织、MSP、VMS和招聘合作公司的专业人士。我们需要这些主题专家来解决项目的“为什么”、“是什么”和“怎么做”。
“为什么”团队:招聘经理、运营主管和公司高管,他们提供商业技能。
“是什么”团队:招聘合作方、采购主管和人事专员,他们提供人力资源方面的技能。
“怎么做”团队:来自临时工企业、客户单位和技术提供商(比如VMS)的数据分析专家,他们知道如何收集信息,如何把信息转换成有意义的结论供决策者参考。
更为重要的是,确保数据团队体现多样化的想法和观点。很多企业认为自己是数据驱动型企业,重度依赖收集自多个信息源的信息,比如客户、员工、供应商等。但如果数据团队成员有太多的共同点(比如来自同一个部门),那么他们对数据的解读常常会带有偏见、过于简单、过于宽泛或者倾向于证明一个假设,而不是揭示一项事实。
再以工作应聘率为例。如果负责收集数据的人同时也是寻找或招聘求职者的人,那么他们最终会陷入防御心态。在这种情况下,他们往往会寻找数据来为他们的挫折辩护。或者,他们过度纠结于应该检查应聘者的哪些方面。而如果数据团队成员来自人力资源、营销、运营和招聘合作方等多种立场呢?引入临时工项目其他方面的利益相关者后,你会更加清楚地知道问题所在,找到解决办法。
找到恰当数据的“甜区”
韦塞尔在文章中写道:“恰当数据有时很大,有时很小。但对创新者来说,关键是弄明白哪些是能够提升竞争力的关键性数据。这些数据就是你应该积极探寻的恰当数据。”
关于项目(无论大小)的数据能把我们以前从来不知道的优秀人才和创新者呈现在我们眼前。我们只需要确保自己看向恰当的地方,翻开恰当的石头。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15