
大数据为何有识才慧眼
前几年,美国麻省理工学院的几位人类行为动力学家将多个传感器组合成一个综合识别器。最初的样子就像一个灰色的盒子,里面装配着一个红外线收发器,一个麦克风和两个加速度传感器。有平装书大小,可以挂在胸前。这个综合传感器,可以将一个人讲话的最重要的信号,例如讲话的时间、当时的情绪、身体的各种反应记录下来,由此可以预测未来行动之趋势、发展之结果。
研究人员把这个“魔盒”带到了电视台“5分钟相亲”节目。参与节目的女性坐成一排,男性则每5分钟换一次位置,与之相互交谈、认识。根据双方交谈,“魔盒”能够预测他们二者是否合得来,能否继续交往下去,以后是否会进一步约会。男女双方交谈的过程,无疑会释放出不少社交信号的。但是,研究人员并不关注双方的言谈内容,而是让“魔盒”记录下双方非常微弱而又微妙的变化:包括声调的微弱变化,眉毛是否突然上扬,语速快慢以及有无插话等。这些都是人们无意识的动作,但是却暴露出了谈话双方的真实思想与情感。
通过反复实验,科学家发现,无须知道双方谈话内容,只凭这些获取的数据,就可以预测双方未来的情感发展结果。准确率达到85%。
现在,这种传感器已经做成了一个徽章大小,可以佩戴在身上。徽章充电一次,可以持续40个小时搜集数据。徽章内置了数据分析算法。佩戴者一年的数据都可以存储在内,通过这个徽章,员工可以了解自己和组织的互动关系,管理者可以了解员工的举止言行,对员工工作进行指导。
计算机到底捕捉了什么
让我们再来看这样一幅画面——
某人打开视频网站,正在观看一则广告,禁不住流露出惊喜的表情。这时,计算机的摄像头提示灯忽然闪了闪,这是什么意思?原来计算机是在做这样的事:对准那个人的眼睛定位,寻找嘴部水平中心线,xyz轴建模,测量他的眼轮匝肌、皱眉肌、颧大肌各块肌肉的位移,数据传回,数据库表情匹配。
通过这样的面部识别技术,是对这个人进行观察判断,准确率可达到96.9%。对于更为复杂的复合情绪识别率能达到76.9%。有家美国公司就专门为顾客提供情绪反应数据。此方法还可以用来进行表情测谎。原理是:人们进行虚假或真实的感情表达时,使用的大脑映射不同,反映在面部肌肉动作上也有不同。人类很难区分的细微感情变化,计算机却很容易。
从面部特征识别到表情识别,再在到情绪识别,计算机利用大数据能够辨别真实与谎言。
上海有位大学生利用商场试衣间,对准“试衣镜”映照出来的各式各样的顾客表情和体势,开发了一个软件,能够帮助老板预判顾客喜欢不喜欢这件正在试穿的商品,以利导购员对顾客讲一些怎样的话,他或她就会愿意购买这件商品。
人类千分之一秒的表情,倏忽而过。但是,计算机却能够迅即捕捉,做出判断,帮助人们决策。
还有伯乐的本事呢
看完上面的案例,你可能会认为基于大数据的识人本领,讲白了就是“以微知著”,拿“千分之一秒”做文章。其实,大数据还有别的本事呢。现在就再举一例。
大家都知道,我们每个用人单位都保存着员工的人事档案。目前,档案里记录的不过是员工的一些自然信息、能力信息、履历信息等,比较简单。如果我们建立一个大数据平台,就可以以这些信息为基础,进一步扩大搜集范围,例如将员工留在社交平台、浏览网站上的数据撷取过来,那就能立刻使他的相关信息丰富起来。
在四川成都,有一位年轻的大数据科学家,建立了基于大数据的“人才雷达”,能够从九个不同的维度,把一个人的相关数据撷取过来,使之丰富化、形象化、个体化。例如,你的“学术水准”,大概是从你的学术论文发表数量与被引用指数那里获取的;你的“社会活跃程度”,大概是从你出席国内外论坛次数那里获得的;你的“阅读领域”,大概是从你的购书记录与浏览网页那里获得的:你的“交往对象”,大概是从你的朋友圈那里获得的;你的“发展潜力”,大概是从你近五年发表论文的影响力那里获得的:你的“生活习惯”,大概是从你的手机、计算机开关时间那里获得的……这样,大数据就能够从四面八方为你或其他任何人画出一幅形象逼真的“素描图”。据报道,现在有的电商已经掌握了每个顾客的一万多个“标签”,就是一万多个特征标志。只要法律允许,画出一张你自己也不知道的“素描图”,应该不是难事。
人们只能长叹一声:“大数据已经炼就了火眼金睛!”
由此不难理解,哪个部门或组织若要寻访人才,依靠大数据,是一个相当不错的渠道。
中国人推崇“伯乐相马”。在今天这个大数据时代,除了有才爱才的个体伯乐和强调公平的制度伯乐外,还有了身手不凡的“大数据伯乐”。三种伯乐各有各的长处,三方结合在一起,必能收“放大增强”之效。
有志于引才的部门与单位,大家何乐而不为呢!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python HTTP 请求工具对比:urllib.request 与 requests 的核心差异与选择指南 在 Python 处理 HTTP 请求(如接口调用、数据爬取 ...
2025-09-12解决 pd.read_csv 读取长浮点数据的科学计数法问题 为帮助 Python 数据从业者解决pd.read_csv读取长浮点数据时的科学计数法问题 ...
2025-09-12CDA 数据分析师:业务数据分析步骤的落地者与价值优化者 业务数据分析是企业解决日常运营问题、提升执行效率的核心手段,其价值 ...
2025-09-12用 SQL 验证业务逻辑:从规则拆解到数据把关的实战指南 在业务系统落地过程中,“业务逻辑” 是连接 “需求设计” 与 “用户体验 ...
2025-09-11塔吉特百货孕妇营销案例:数据驱动下的精准零售革命与启示 在零售行业 “流量红利见顶” 的当下,精准营销成为企业突围的核心方 ...
2025-09-11CDA 数据分析师与战略 / 业务数据分析:概念辨析与协同价值 在数据驱动决策的体系中,“战略数据分析”“业务数据分析” 是企业 ...
2025-09-11Excel 数据聚类分析:从操作实践到业务价值挖掘 在数据分析场景中,聚类分析作为 “无监督分组” 的核心工具,能从杂乱数据中挖 ...
2025-09-10统计模型的核心目的:从数据解读到决策支撑的价值导向 统计模型作为数据分析的核心工具,并非简单的 “公式堆砌”,而是围绕特定 ...
2025-09-10CDA 数据分析师:商业数据分析实践的落地者与价值创造者 商业数据分析的价值,最终要在 “实践” 中体现 —— 脱离业务场景的分 ...
2025-09-10机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04