走出大数据的“大”的误区，大数据不在数据之大-CDA数据分析师官网

热线电话：13121318867

走出大数据的“大”的误区，大数据不在数据之大

2017-03-15

走出大数据的“大”的误区，大数据不在数据之大

“大数据”已经成为21世纪商业的代名词。聚拢大量数据的浪潮正变得愈加猛烈。公司无论所属行业和规模大小，都竭力想要实现招聘自动化，将流程数字化，并且打造出客户和求职者的信息库。企业管理层必须面对的问题不在于收集了多少数据，而在于是否拥有恰当的数据，以及如何解读这些数据。

大数据太大？

麦克斯维尔·韦塞尔（Maxwell Wessel）在《哈佛商业评论》的一篇文章中说，我们用来捕捉信息的网正一天天地越铺越大。可能影响到招聘或管理劳动力的所有因素似乎都被一网打尽。

“利用大量的社会、天气和政府数据预测供应链中断。”韦塞尔写道，“利用大量的用户数据在汪洋般的网站点击中识别个人用户。企业甚至开始利用海量的文字交流信息来开发能够和客户对话的电脑算法。”

如今，这一切在行业内均有发生，甚至已将人工智能（AI）用作为招聘工具。FirstJob推出了Mya，这款AI系统利用自然语言处理和机器学习，旨在令75%的招聘过程实现自动化。

与亚马逊（Amazon）的Alexa和苹果（Apple）的Siri等虚拟助理一样，Mya也能模拟对话，和用户进行复杂一点的互动。通过这些交流，Mya可以不断收集求职者的数据，比如他们的技能、敬业度、文化契合度等等，然后将这些数据被转换成可量化的情报。

由于Mya才刚刚面世，其效果还有待观察。但问题依旧：在Mya从无数求职者那里收集的大量信息中，有多少是有用的？有多少是可执行的？有多少是多余的？

小而恰当的数据据佳例Uber

尽管毁誉参半，但Uber的确成功展现了数据分析的力量。投资者和商业专家早就把这款按需网约车应用称为大数据的楷模。Uber会从司机和乘客那里收集大量信息，按照韦塞尔的说法，这使它能够规划“人类交通的实时物流”。然而，韦塞尔也指出了Uber数据真实规模的一个关键性的特点。

威塞尔说：“Uber的成功并不在于它收集的大量数据，而是来自截然不同的方向：小而恰当的数据。Uber就是利用这样的数据来调度车辆。”

在Uber急速崛起之前，乘客是靠出租车来实现类似的服务。韦塞尔说，虽然没有电脑收集和处理数据，但“在城市街道上用眼睛搜索潜在乘客”的做法本身就是一种收集和分析数据的大型程序。

“尽管计算发生在人脑内部，但被收集和分析的数据量并没有不同。”他说，“Uber巧妙的解决方案就是不再对视觉数据应用生物异常探测算法，而是利用恰当数据来完成这项任务。谁需要打车？他们在哪里？这些至关重要的信息让Uber、Lyft和滴滴出行等公司彻底改革了一个行业。”

恰当调整你的大数据规模

1识别浪费

想要弄清楚数据的恰当规模，关键是识别“浪费”。韦塞尔以花店为例。普通零售花店的损耗率高达50%，这意味着一半的漂亮花束还没有卖出去就被扔进垃圾箱。不过，浪费却是机遇的一个宝贵来源。

“无论是工业生产、零售还是法律调查，应该弄清楚精力和资源遭到浪费的源头，以此找出迈向恰当数据的方向。”韦塞尔写道。

对于领导层来说，在确定恰当的人才数据时，第一步就是找出浪费掉的精力或者无用的流程。假设你的工作应聘率为1:5或更低，这就意味着你的招聘人员或者招聘合作方收到的简历不够多。于是你就找出了“浪费”的源头和改善流程的机会。

2减少浪费

这时，你决定将重点放在减少浪费上，想办法改变流程，防止精力被浪费或者无效。还是以工作应聘率问题为例，我们需要开始积累、分析和合成与这个问题有关的数据。

职位描述写得怎么样？是否有吸引力？对客户和应聘者双方来说，是否都准确反映了该职位的要求和福利？

是否利用了恰当的招聘渠道？如果传统的招聘渠道效果不好，那就分析社交网络、在线群体、社区、大学系统和其他媒介的数据。也许LinkedIn和Facebook是比全球最大招聘网站Monster更好的招聘渠道。

招聘宣传做得怎么样？这个过程是人工完成的吗？能不能实现自动化？

对比失败的开端或者应聘者寥寥无几的场面，那些成功的招聘工作又是怎么样的？分析这些数据将帮助你从中吸取经验。

3建立有意义的数据集

着眼全局，思考数据如何影响整间公司和所有员工。

防范确认性偏见。像《流言终结者》节目主持人那样进行分析。尝试推翻被广泛接受的标准。敢于承担风险、失败和意外结果。所有这些都是重要的学习经历，将会帮助你改善流程。

利用可靠、有效、干净和完整的数据集。数据应该是客观的，而不是仅仅基于特定的商业团体、人才类别、公司部门或者招聘经理。

进行跨团体、跨时间的比较。

4立刻让盟友、利益相关者和合作伙伴参与进来

如果利益相关者不知情，没有参与进来，那么即使是考虑最全面、执行最到位的分析也可能失败。让其他人也加入这趟发现之旅，向他们征求意见。你会发现，被赋予了决策权的人往往更愿意参与其中，检查研究结果，了解其价值，落实修改意见。如果忽视这一点，所有努力都可能付之东流。

要是没有事先告知和参与，此过程中的其他利益相关者可能会觉得有人在对自己的工作指手画脚，尤其是在他们认为自己明明做得很好的情况下。尽管另一方面的用意是好的，但被动接受者会觉得自己被蒙在了鼓里。如果发生这样的事情，重要的计划可能却会应者寥寥，得不到落实，这相当于是在浪费机会、时间和金钱。

5创建数据团队

创建恰当的数据团队是必要之举，在收集和分析数据之前就应该着手进行。虽然在项目经理的头脑和追踪系统（比如VMS、ATS、企业资源系统等等）里，存放着堆积如山的有用数据，但必须通过多方协作才能作出周详的决定。最好的数据团队应该具有广泛的代表性。在项目中，应该包含来自客户组织、MSP、VMS和招聘合作公司的专业人士。我们需要这些主题专家来解决项目的“为什么”、“是什么”和“怎么做”。

“为什么”团队：招聘经理、运营主管和公司高管，他们提供商业技能。

“是什么”团队：招聘合作方、采购主管和人事专员，他们提供人力资源方面的技能。

“怎么做”团队：来自临时工企业、客户单位和技术提供商（比如VMS）的数据分析专家，他们知道如何收集信息，如何把信息转换成有意义的结论供决策者参考。

更为重要的是，确保数据团队体现多样化的想法和观点。很多企业认为自己是数据驱动型企业，重度依赖收集自多个信息源的信息，比如客户、员工、供应商等。但如果数据团队成员有太多的共同点（比如来自同一个部门），那么他们对数据的解读常常会带有偏见、过于简单、过于宽泛或者倾向于证明一个假设，而不是揭示一项事实。

再以工作应聘率为例。如果负责收集数据的人同时也是寻找或招聘求职者的人，那么他们最终会陷入防御心态。在这种情况下，他们往往会寻找数据来为他们的挫折辩护。或者，他们过度纠结于应该检查应聘者的哪些方面。而如果数据团队成员来自人力资源、营销、运营和招聘合作方等多种立场呢？引入临时工项目其他方面的利益相关者后，你会更加清楚地知道问题所在，找到解决办法。

找到恰当数据的“甜区”

韦塞尔在文章中写道：“恰当数据有时很大，有时很小。但对创新者来说，关键是弄明白哪些是能够提升竞争力的关键性数据。这些数据就是你应该积极探寻的恰当数据。”

关于项目（无论大小）的数据能把我们以前从来不知道的优秀人才和创新者呈现在我们眼前。我们只需要确保自己看向恰当的地方，翻开恰当的石头。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；