京公网安备 11010802034615号
经营许可证编号:京B2-20210330
从大数据到大分析,口碑比过去更有力
你的口碑会决定你交谈的对象,以及他们会和你一起做或为你做的事。口碑也会影响银行是否会借钱给你买房子或车子、影响房东是否愿意租你房子,也会决定哪些雇主愿意录用你或者你是不是能找到工作。口碑也可能决定你得到的特别优惠与贵宾体验的种类,而且也可能大大地影响到你潜在的约会对象。另外,你在保险业者之间的口碑,会决定你得到的保险范围是否能涵盖健康、汽车、房子或寿险。而你在政府机关的口碑甚至会影响你,是否会因为某个犯罪行为而被调查。
现在,口碑的力量比过去任何时期都更加强大。这一切都要感谢数据科技的快速发展,你的口碑将会无所不在、永久保留,而且,不管你喜不喜欢,在全球各地都可以取得。无论你到哪里,不论你是否知情或同意,其他人都能立刻取得关於你个人口碑的资讯。
在所谓的「大数据」(Big Data),也就是收集与保存大量资讯的趋势之後,口碑的影响力就顺势发展得极为顺利。但是,新颖的口碑经济则仰赖我们称为「大分析」(Big Analysis)的力量,这是一种新的系统,可以从收集到的巨量数据中,萃取有关个人的大量预测性资讯,然後把它转化为行动:否决你的贷款申请、找你面谈一份甚至还没公告的工作、或甚至把已经站在门口的潜在约会对象直接打发掉。以上这些可能发生的事,都是因为你的口碑,正以各式各样令人头昏且精密的方式重新数据化且互相串连。
当然,口碑一直都很重要,只要问一下任何一个住过小镇的人,口碑可以维持多久,以及口碑如何影响他们的社交互动就好,特别是如果他们曾经犯了一个重大错误的话。但是在口碑经济时代以前,口碑只能在同侪互动之後慢慢形成,很少人对於非名人的大多数市井小民也能够无所不知,而且,口碑的维持也只能和人类的记忆一样久而已。
现在,从收集、保存、分析并分配各式各样有关你的个人资讯,包括人口统计数据、驾驶纪录到你上网活动的完整纪录,数据科技都办得到。二○一○年代的商业行话,所谓的「数据采集」(data mining)趋势,让人针对几乎每一个能想像得到的主题,都能收集到海量的数据。这种技术会存在,是因为科技已经让收集与保存数据的费用,几近於零成本。一个理解现在的数据数据保存容量最简单的方法就是,1TB容量的硬碟,可以保存的资讯,比起放在普通研究图书馆里的数据还要多。现在,消费者已经可以买到这种硬碟,还可以俐落地放在大一点的裤子口袋里或小皮包里,花费还算便宜,不到一百美元,而且这个价格每年都在调降。结果就是,在今天,任何公司或个人都不需要大公司(或美国国家安全局)的资源,就可以保存有关其他人几乎无限制的个人数据。关於保存数据的方式,可以追溯到数千年前,从在泥板上辛苦地复写、到模具压制印刷、到今天用的磁性媒介,到很快的未来即将用到的具体装置。现在,由於保存数据的价格崩跌,几乎无限量的数据都可以用以前不可能的方式保存与处理。
现在,数据资讯的保存实际上可以说是免费的,任何东西都可以被永久地收集与保存起来,而且很快就会演变成保存大量的数据组会比找出哪些数据要删除,要更便宜。接着,一旦数据可以被取得,就一定会有人想出用途。所以,有关每一个人海量的数据数据,包括所有你到访的网站和你点击的任何连结,都会被整理出来。现在甚至有一个快速成长、有关数据库与数据保存网站的地下经济,正在悄悄地收集数以兆计的线上活动资讯,只是在等着想出使用这些数据的方法。
虽然「大数据」想起来很恐怖,但如果不知道如何使用,这些进进出出的数据其实一文不值,只是一系列的「1」与「0」罢了。大数据真正的力量(不管是为了良善或邪恶的目的)是在下一个步骤,藉由新的电脑系统与演算法,在数以百万笔的数据中进行分类与筛选,最後找出可以据以行动的理解力。因此,未来不是被掌控在收集最多数据的公司或个人身上,而是能够找出这些海量数据组最大意义的人,这就是「大分析」。如果大数据可以被理解为你正坐在金矿上,大分析事实上就是把金子从地下挖出来,而且已经把它变成金条了。
从大数据到大分析的变化是巨大的,这不只是保存数据的容量变大,也包括解读、分类与分析数据的能力大幅提升了。如果摩尔定律──电脑的运算能力每两年增加一倍──和过去数十年一样继续有效,那麽未来数据分析的力量也会继续成长。结果很可能是,人们会开始委托电脑做更多决定,包括过去由人类做的数百万种决定。
想知道这会对你造成什麽影响,不妨想想看,企业现在如何发展出各式各样的系统,以便在每一分钟内就做出数百万个有关消费者(像你这样的人)的决定。而且这类决策范围也在快速扩展中,从合理而不令人意外的决定,例如试着辨识不正常的交易以降低信用卡诈骗事件,到会让你觉得震惊的事,范围可能从保险业者会根据线上活动而拒绝承保、公司会根据电脑驱动的分析自动决定人员的晋用与升迁、到行动电话让人在酒吧可以即时查核某人的背景等等。根据你买了这本书这件事,又会被做成什麽样的决定呢?希望是好的决定,但我们会在下一章做更进一步的探讨。
很快地,根据你每一件事的口碑,从是否工作勤奋、具有财务责任到健康状况,企业会利用这些大量的数据组来评分你的口碑,类似FICO信用分数(credit score) 的意思。就像搜寻引擎让使用者可以在全球资讯网上搜寻资讯,「口碑引擎」(reputation engine)也会让企业,并慢慢地让每个人,去搜寻你的数据足迹,以找到有关你上线与离线时的活动和人际互动资讯。但是,请把信用分数想像成即将到来的口碑经济一种非常原始的版本;如果把信用分数比为传统的市内电话听筒,那麽未来的口碑分数就会像最新款的iPhone。不管你想不想参与其中,这都会发生,而这些分数就会被别人用来做出与你有关的重大决定,比如说要不要录用你、要不要让你加保、甚至要不要和你约会等等。
而且,这些决定做得比以前任何时间更快。你以前听过一眨眼之间做的决策吧,现在,电脑以快数千倍的时间,做出了大部分的决定。人类的一眨眼可能是四百毫秒(按:一秒的百万分之一)的时间,在这段时间,一台普通的笔记型电脑几乎就能运算十亿次。这种持续增加的速度所带来的冲击是惊人的,事实上,由令人头昏的复杂演算法驱动的口碑引擎,现在已经可以在每一秒钟收集超过数百万笔的纪录,以便辨识出优良或恶劣的信用风险、以及可能在考虑辞职的员工,还有其他更多可能。举个简单的例子,你现在比以前更常在工作时浏览领英(LinkedIn,最大的专业人才社交网站)吗?很多演算法把这当成员工正在找新工作的危险信号。如果这资讯是由招募单位取得,他们可能会打电话给你,引诱你接受新的工作机会。如果是被你公司得知这项资讯,他们或许会找你谈谈怎样才能留住你,或者把你快速踢出公司大门。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01在数据驱动决策的时代,企业与从业者每天都会面对海量数据——电商平台的用户行为数据、金融机构的信贷风险数据、快消品牌的营销 ...
2026-04-01在数字化转型的浪潮中,企业数据已从“辅助运营的附属资源”升级为“驱动增长的核心资产”,而一套科学、可落地的企业数据管理方 ...
2026-04-01在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30在CDA(Certified Data Analyst)数据分析师的日常工作中,“无监督分组、挖掘数据内在聚类规律”是高频核心需求——电商场景中 ...
2026-03-30机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26