京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据为何有识才慧眼
前几年,美国麻省理工学院的几位人类行为动力学家将多个传感器组合成一个综合识别器。最初的样子就像一个灰色的盒子,里面装配着一个红外线收发器,一个麦克风和两个加速度传感器。有平装书大小,可以挂在胸前。这个综合传感器,可以将一个人讲话的最重要的信号,例如讲话的时间、当时的情绪、身体的各种反应记录下来,由此可以预测未来行动之趋势、发展之结果。
研究人员把这个“魔盒”带到了电视台“5分钟相亲”节目。参与节目的女性坐成一排,男性则每5分钟换一次位置,与之相互交谈、认识。根据双方交谈,“魔盒”能够预测他们二者是否合得来,能否继续交往下去,以后是否会进一步约会。男女双方交谈的过程,无疑会释放出不少社交信号的。但是,研究人员并不关注双方的言谈内容,而是让“魔盒”记录下双方非常微弱而又微妙的变化:包括声调的微弱变化,眉毛是否突然上扬,语速快慢以及有无插话等。这些都是人们无意识的动作,但是却暴露出了谈话双方的真实思想与情感。
通过反复实验,科学家发现,无须知道双方谈话内容,只凭这些获取的数据,就可以预测双方未来的情感发展结果。准确率达到85%。
现在,这种传感器已经做成了一个徽章大小,可以佩戴在身上。徽章充电一次,可以持续40个小时搜集数据。徽章内置了数据分析算法。佩戴者一年的数据都可以存储在内,通过这个徽章,员工可以了解自己和组织的互动关系,管理者可以了解员工的举止言行,对员工工作进行指导。
计算机到底捕捉了什么
让我们再来看这样一幅画面——
某人打开视频网站,正在观看一则广告,禁不住流露出惊喜的表情。这时,计算机的摄像头提示灯忽然闪了闪,这是什么意思?原来计算机是在做这样的事:对准那个人的眼睛定位,寻找嘴部水平中心线,xyz轴建模,测量他的眼轮匝肌、皱眉肌、颧大肌各块肌肉的位移,数据传回,数据库表情匹配。
通过这样的面部识别技术,是对这个人进行观察判断,准确率可达到96.9%。对于更为复杂的复合情绪识别率能达到76.9%。有家美国公司就专门为顾客提供情绪反应数据。此方法还可以用来进行表情测谎。原理是:人们进行虚假或真实的感情表达时,使用的大脑映射不同,反映在面部肌肉动作上也有不同。人类很难区分的细微感情变化,计算机却很容易。
从面部特征识别到表情识别,再在到情绪识别,计算机利用大数据能够辨别真实与谎言。
上海有位大学生利用商场试衣间,对准“试衣镜”映照出来的各式各样的顾客表情和体势,开发了一个软件,能够帮助老板预判顾客喜欢不喜欢这件正在试穿的商品,以利导购员对顾客讲一些怎样的话,他或她就会愿意购买这件商品。
人类千分之一秒的表情,倏忽而过。但是,计算机却能够迅即捕捉,做出判断,帮助人们决策。
还有伯乐的本事呢
看完上面的案例,你可能会认为基于大数据的识人本领,讲白了就是“以微知著”,拿“千分之一秒”做文章。其实,大数据还有别的本事呢。现在就再举一例。
大家都知道,我们每个用人单位都保存着员工的人事档案。目前,档案里记录的不过是员工的一些自然信息、能力信息、履历信息等,比较简单。如果我们建立一个大数据平台,就可以以这些信息为基础,进一步扩大搜集范围,例如将员工留在社交平台、浏览网站上的数据撷取过来,那就能立刻使他的相关信息丰富起来。
在四川成都,有一位年轻的大数据科学家,建立了基于大数据的“人才雷达”,能够从九个不同的维度,把一个人的相关数据撷取过来,使之丰富化、形象化、个体化。例如,你的“学术水准”,大概是从你的学术论文发表数量与被引用指数那里获取的;你的“社会活跃程度”,大概是从你出席国内外论坛次数那里获得的;你的“阅读领域”,大概是从你的购书记录与浏览网页那里获得的:你的“交往对象”,大概是从你的朋友圈那里获得的;你的“发展潜力”,大概是从你近五年发表论文的影响力那里获得的:你的“生活习惯”,大概是从你的手机、计算机开关时间那里获得的……这样,大数据就能够从四面八方为你或其他任何人画出一幅形象逼真的“素描图”。据报道,现在有的电商已经掌握了每个顾客的一万多个“标签”,就是一万多个特征标志。只要法律允许,画出一张你自己也不知道的“素描图”,应该不是难事。
人们只能长叹一声:“大数据已经炼就了火眼金睛!”
由此不难理解,哪个部门或组织若要寻访人才,依靠大数据,是一个相当不错的渠道。
中国人推崇“伯乐相马”。在今天这个大数据时代,除了有才爱才的个体伯乐和强调公平的制度伯乐外,还有了身手不凡的“大数据伯乐”。三种伯乐各有各的长处,三方结合在一起,必能收“放大增强”之效。
有志于引才的部门与单位,大家何乐而不为呢!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22