
从大数据到大分析,口碑比过去更有力
你的口碑会决定你交谈的对象,以及他们会和你一起做或为你做的事。口碑也会影响银行是否会借钱给你买房子或车子、影响房东是否愿意租你房子,也会决定哪些雇主愿意录用你或者你是不是能找到工作。口碑也可能决定你得到的特别优惠与贵宾体验的种类,而且也可能大大地影响到你潜在的约会对象。另外,你在保险业者之间的口碑,会决定你得到的保险范围是否能涵盖健康、汽车、房子或寿险。而你在政府机关的口碑甚至会影响你,是否会因为某个犯罪行为而被调查。
现在,口碑的力量比过去任何时期都更加强大。这一切都要感谢数据科技的快速发展,你的口碑将会无所不在、永久保留,而且,不管你喜不喜欢,在全球各地都可以取得。无论你到哪里,不论你是否知情或同意,其他人都能立刻取得关於你个人口碑的资讯。
在所谓的「大数据」(Big Data),也就是收集与保存大量资讯的趋势之後,口碑的影响力就顺势发展得极为顺利。但是,新颖的口碑经济则仰赖我们称为「大分析」(Big Analysis)的力量,这是一种新的系统,可以从收集到的巨量数据中,萃取有关个人的大量预测性资讯,然後把它转化为行动:否决你的贷款申请、找你面谈一份甚至还没公告的工作、或甚至把已经站在门口的潜在约会对象直接打发掉。以上这些可能发生的事,都是因为你的口碑,正以各式各样令人头昏且精密的方式重新数据化且互相串连。
当然,口碑一直都很重要,只要问一下任何一个住过小镇的人,口碑可以维持多久,以及口碑如何影响他们的社交互动就好,特别是如果他们曾经犯了一个重大错误的话。但是在口碑经济时代以前,口碑只能在同侪互动之後慢慢形成,很少人对於非名人的大多数市井小民也能够无所不知,而且,口碑的维持也只能和人类的记忆一样久而已。
现在,从收集、保存、分析并分配各式各样有关你的个人资讯,包括人口统计数据、驾驶纪录到你上网活动的完整纪录,数据科技都办得到。二○一○年代的商业行话,所谓的「数据采集」(data mining)趋势,让人针对几乎每一个能想像得到的主题,都能收集到海量的数据。这种技术会存在,是因为科技已经让收集与保存数据的费用,几近於零成本。一个理解现在的数据数据保存容量最简单的方法就是,1TB容量的硬碟,可以保存的资讯,比起放在普通研究图书馆里的数据还要多。现在,消费者已经可以买到这种硬碟,还可以俐落地放在大一点的裤子口袋里或小皮包里,花费还算便宜,不到一百美元,而且这个价格每年都在调降。结果就是,在今天,任何公司或个人都不需要大公司(或美国国家安全局)的资源,就可以保存有关其他人几乎无限制的个人数据。关於保存数据的方式,可以追溯到数千年前,从在泥板上辛苦地复写、到模具压制印刷、到今天用的磁性媒介,到很快的未来即将用到的具体装置。现在,由於保存数据的价格崩跌,几乎无限量的数据都可以用以前不可能的方式保存与处理。
现在,数据资讯的保存实际上可以说是免费的,任何东西都可以被永久地收集与保存起来,而且很快就会演变成保存大量的数据组会比找出哪些数据要删除,要更便宜。接着,一旦数据可以被取得,就一定会有人想出用途。所以,有关每一个人海量的数据数据,包括所有你到访的网站和你点击的任何连结,都会被整理出来。现在甚至有一个快速成长、有关数据库与数据保存网站的地下经济,正在悄悄地收集数以兆计的线上活动资讯,只是在等着想出使用这些数据的方法。
虽然「大数据」想起来很恐怖,但如果不知道如何使用,这些进进出出的数据其实一文不值,只是一系列的「1」与「0」罢了。大数据真正的力量(不管是为了良善或邪恶的目的)是在下一个步骤,藉由新的电脑系统与演算法,在数以百万笔的数据中进行分类与筛选,最後找出可以据以行动的理解力。因此,未来不是被掌控在收集最多数据的公司或个人身上,而是能够找出这些海量数据组最大意义的人,这就是「大分析」。如果大数据可以被理解为你正坐在金矿上,大分析事实上就是把金子从地下挖出来,而且已经把它变成金条了。
从大数据到大分析的变化是巨大的,这不只是保存数据的容量变大,也包括解读、分类与分析数据的能力大幅提升了。如果摩尔定律──电脑的运算能力每两年增加一倍──和过去数十年一样继续有效,那麽未来数据分析的力量也会继续成长。结果很可能是,人们会开始委托电脑做更多决定,包括过去由人类做的数百万种决定。
想知道这会对你造成什麽影响,不妨想想看,企业现在如何发展出各式各样的系统,以便在每一分钟内就做出数百万个有关消费者(像你这样的人)的决定。而且这类决策范围也在快速扩展中,从合理而不令人意外的决定,例如试着辨识不正常的交易以降低信用卡诈骗事件,到会让你觉得震惊的事,范围可能从保险业者会根据线上活动而拒绝承保、公司会根据电脑驱动的分析自动决定人员的晋用与升迁、到行动电话让人在酒吧可以即时查核某人的背景等等。根据你买了这本书这件事,又会被做成什麽样的决定呢?希望是好的决定,但我们会在下一章做更进一步的探讨。
很快地,根据你每一件事的口碑,从是否工作勤奋、具有财务责任到健康状况,企业会利用这些大量的数据组来评分你的口碑,类似FICO信用分数(credit score) 的意思。就像搜寻引擎让使用者可以在全球资讯网上搜寻资讯,「口碑引擎」(reputation engine)也会让企业,并慢慢地让每个人,去搜寻你的数据足迹,以找到有关你上线与离线时的活动和人际互动资讯。但是,请把信用分数想像成即将到来的口碑经济一种非常原始的版本;如果把信用分数比为传统的市内电话听筒,那麽未来的口碑分数就会像最新款的iPhone。不管你想不想参与其中,这都会发生,而这些分数就会被别人用来做出与你有关的重大决定,比如说要不要录用你、要不要让你加保、甚至要不要和你约会等等。
而且,这些决定做得比以前任何时间更快。你以前听过一眨眼之间做的决策吧,现在,电脑以快数千倍的时间,做出了大部分的决定。人类的一眨眼可能是四百毫秒(按:一秒的百万分之一)的时间,在这段时间,一台普通的笔记型电脑几乎就能运算十亿次。这种持续增加的速度所带来的冲击是惊人的,事实上,由令人头昏的复杂演算法驱动的口碑引擎,现在已经可以在每一秒钟收集超过数百万笔的纪录,以便辨识出优良或恶劣的信用风险、以及可能在考虑辞职的员工,还有其他更多可能。举个简单的例子,你现在比以前更常在工作时浏览领英(LinkedIn,最大的专业人才社交网站)吗?很多演算法把这当成员工正在找新工作的危险信号。如果这资讯是由招募单位取得,他们可能会打电话给你,引诱你接受新的工作机会。如果是被你公司得知这项资讯,他们或许会找你谈谈怎样才能留住你,或者把你快速踢出公司大门。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Pandas 选取特定值所在行:6 类核心方法与实战指南 在使用 pandas 处理结构化数据时,“选取特定值所在的行” 是最高频的操作之 ...
2025-09-30球面卷积神经网络(SCNN) 为解决这一痛点,球面卷积神经网络(Spherical Convolutional Neural Network, SCNN) 应运而生。它通 ...
2025-09-30在企业日常运营中,“未来会怎样” 是决策者最关心的问题 —— 电商平台想知道 “下月销量能否达标”,金融机构想预判 “下周股 ...
2025-09-30Excel 能做聚类分析吗?基础方法、进阶技巧与场景边界 在数据分析领域,聚类分析是 “无监督学习” 的核心技术 —— 无需预设分 ...
2025-09-29XGBoost 决策树:原理、优化与工业级实战指南 在机器学习领域,决策树因 “可解释性强、处理非线性关系能力突出” 成为基础模型 ...
2025-09-29在标签体系的落地链路中,“设计标签逻辑” 只是第一步,真正让标签从 “纸上定义” 变为 “业务可用资产” 的关键,在于标签加 ...
2025-09-29在使用 Excel 数据透视表进行多维度数据汇总时,折叠功能是梳理数据层级的核心工具 —— 通过点击 “+/-” 符号可展开明细数据或 ...
2025-09-28在使用 Pandas 处理 CSV、TSV 等文本文件时,“引号” 是最容易引发格式混乱的 “隐形杀手”—— 比如字段中包含逗号(如 “北京 ...
2025-09-28在 CDA(Certified Data Analyst)数据分析师的技能工具箱中,数据查询语言(尤其是 SQL)是最基础、也最核心的 “武器”。无论 ...
2025-09-28Cox 模型时间依赖性检验:原理、方法与实战应用 在生存分析领域,Cox 比例风险模型(Cox Proportional Hazards Model)是分析 “ ...
2025-09-26检测因子类型的影响程度大小:评估标准、实战案例与管控策略 在检测分析领域(如环境监测、食品质量检测、工业产品合规性测试) ...
2025-09-26CDA 数据分析师:以数据库为基石,筑牢数据驱动的 “源头防线” 在数据驱动业务的链条中,“数据从哪里来” 是 CDA(Certified D ...
2025-09-26线性相关点分布的四种基本类型:特征、识别与实战应用 在数据分析与统计学中,“线性相关” 是描述两个数值变量间关联趋势的核心 ...
2025-09-25深度神经网络神经元个数确定指南:从原理到实战的科学路径 在深度神经网络(DNN)的设计中,“神经元个数” 是决定模型性能的关 ...
2025-09-25在企业数字化进程中,不少团队陷入 “指标困境”:仪表盘上堆砌着上百个指标,DAU、转化率、营收等数据实时跳动,却无法回答 “ ...
2025-09-25MySQL 服务器内存碎片:成因、检测与内存持续增长的解决策略 在 MySQL 运维中,“内存持续增长” 是常见且隐蔽的性能隐患 —— ...
2025-09-24人工智能重塑工程质量检测:核心应用、技术路径与实践案例 工程质量检测是保障建筑、市政、交通、水利等基础设施安全的 “最后一 ...
2025-09-24CDA 数据分析师:驾驭通用与场景指标,解锁数据驱动的精准路径 在数据驱动业务的实践中,指标是连接数据与决策的核心载体。但并 ...
2025-09-24在数据驱动的业务迭代中,AB 实验系统(负责验证业务优化效果)与业务系统(负责承载用户交互与核心流程)并非独立存在 —— 前 ...
2025-09-23CDA 业务数据分析:6 步闭环,让数据驱动业务落地 在企业数字化转型中,CDA(Certified Data Analyst)数据分析师的核心价值,并 ...
2025-09-23