
大数据时代,我们越来越以为外面的世界是真实的.....
遥想洪荒年代,有时候觉得,那会也是蛮好的,一切都赤裸裸的真实。
土地赤裸裸的真实,没有化肥加持;河流赤裸裸的真实,没有杂质;植物赤裸裸的真实,没有农药帮着祛除虫害;天空赤裸裸的真实,没有雾霾……
当然,“人”也赤裸裸的真实,从内到外。
在学习独立行走、打磨石器的过程中,“人”们的大脑日益发达,交流的方式,已经不再满足于用手势比活,或是挤眉弄眼地咿咿呀呀。语言的产生,随之水到渠成。
语言当然只是一种媒介,它离不开说话的“人”。那会,连土制的扩音设备也没有,所以,即便一个“人”嗓门再大,传播所及也很寥寥。交流,只能面对面口耳相传。
“人”变成了人,变得愈发聪明。拿根绳子打个结,或是在树上划上几道,按照事先达成的默契,就能表达或者解读出相关信息。这样,说话的人就不必一脸呆萌地站在原地傻等,别人只要看到他的“留言”,就能知道他想说啥。思想的传递,就此摆脱了对表达主体的物理束缚,传播也就慢慢突破了眼前的一亩三分地,变得更加广泛。
文字的形成,是“结绳记事”的2.0版。从功用来说,它们都实现了对表达主体的解放,但文字进一步减少了交流成本,不仅不用非得留一根打好结的绳子给对方,而且也不至于造成误会,因为你打这种结,本想表示跟他借钱,但在他们那堆人里面,这个结很有可能是表达爱意。文字更加一目了然,而且约定俗成的范围更广。
当然,文字刻在龟背或是竹简上还是有问题。写一封洋洋洒洒的情书给恋人,光搬运竹简就得累个半死,哪还有风花雪月的闲情逸致。所以,纸张和印刷术,又把传播向前推进了一大步,人类在传播上的局限,获得了物理上的突破。
这种突破一直在演进,最后出现了大众媒体。广播延伸了人的耳朵,电视延伸了人的眼睛,在本质上,它们同结绳记事延伸了人的身体是一样的,但更高端,更时尚,更让当时的人不明觉厉。
人类获得的自我解放,传播的发展功不可没。它让原本只能了解“目之所及”世界的人们,能够“听”到更多,“看”到更远,让远在天边的人,真的仿佛近在眼前。不同大陆的人因此有了探索其他大陆的欲望,由此也形成和推动了世界性的交往。
我们超越了“目之所及”,但是从此,那个赤裸裸真实的世界,模糊了,远去了,直至扭曲了。
二
早在20世纪20年代,美国著名政论家李普曼就在其所著的《公众舆论》一书中,首次使用“Pseudo-environment”一词,论及“拟态环境”问题。简单说,就是我们“了解”的世界,并不是真实世界的高保真还原,而是大众媒体为我们描摹出的“世界”。
举个例子说吧。假设你生活的城市,一天中总计发生了100件事。囿于容量有限,媒体需要根据自己的判断和价值观,对这100件事做出取舍,挑出10件来说给你听。再假设,这100件事中,60件是司空见惯的家长里短,30件是“美好人间”类的故事,让人觉得生活还不错,还有10件则是凶杀、盗窃、灾难等等,听着就让人揪心的事情。
媒体会怎么抉择?按照一般原则,那60件稀松平常的事情,媒体是不感兴趣的,先筛掉。在剩下来的40件事情中,媒体可能会优先选择最后10件中的一部分。为什么?其实很正常,尽管西方新闻观和马克思主义新闻观有许多质的不同,但是,“反常性”是被业界公认的新闻价值标准的。除此之外,媒体也会在那30件中挑选一些,因为人们也会喜欢“童话故事”。
那么好了,假设媒体尽最大诚意保持专业精神,挑选了30件令人高兴的事情当中的5件,以及10件令人悲伤的事情当中的5件,好事和坏事的比例是5:5(事实上,许多媒体是不会遵从这个比例的,它们对“坏事”的报道兴趣远胜过“好事”)。
看上去,还是挺平衡的吧?那么,你会因此对你生活的这个城市形成什么印象呢?
简单化地推断,你可能会认为这个城市喜忧参半,但是鉴于人们对于危险更为重视,印象更加深刻,所以你实际上会认为这个城市实在太糟糕了,竟然这么乱。
现在应该清楚了,你对这个城市,并不是按6:3:1的比例形成总体印象,尽管那才是城市的本来面目。
前几天,《人民日报》的小伙伴写了一篇介绍香港的文章,就是这种情况。
这还仅仅是一个城市,我们对自己的生活的城市至少还有不少直观的认知。推而广之,如果是别的城市、别的国家、别的大陆,这样的认知偏差还会更大。
其实历史也是一样。历史是一个无法确认起点的隧洞。我们发现了的各种文物、史料,如同一根根蜡烛,照亮了它周边的区域,但并不能让整个隧洞都灯火通明。我们把一点点烛光串起,勉强把烛光照射到的地方,连缀成历史。那些没有烛照的地方,就成了历史的黑洞。
所以我们了解的历史,同真实的历史也是不一样的。
回到现实。客观地说,“拟态环境”跟媒体有关,但不能怪媒体。
媒体每天向我们输送各种信息,让我们可以突破信息采集器官的局限,了解遥不可及的外部世界是个什么样子。在不可能做到事事都眼见为实的情况下,我们就必须在了解更多外部世界同把握世界真实之间做出选择。
前者显然占据上风,而媒体就承担了这个重任。
但是,对真实世界的探求,不仅是必须的,也是必要的。做到这一点,一来需要媒体“良心”,能够公正、客观、真实的反映现实,不仅是单个事实的真实,还要能通过这些单个事实,反映世界的整体和本质;二来需要人们自己的“理性”,能够在纷繁复杂的信息海洋中,作出合规律性的判断,不被各种暗藏陷阱的信息蒙蔽。
当然,这两个方面,能够做到任何一个都很难。
三
现在,更难的事情来了。
社交媒体的出现,不仅让媒体的“良心”常常无计可施,也让人们的“理性”面临更大的风险。
虽然也被称为“媒体”,但是社交媒体(social media)和传统意义上的大众媒体还是存在显著不同。过去,大众媒体有一个引以为傲的能力,就是议题设置。我不能左右这个世界发生什么,但我能左右你关注什么。这种能力,某种意义上说,正是人们对外部世界的理解产生偏差的“罪魁祸首”。
社交媒体则让用户享有了更多的选择权利和编辑能力,人们自发集结成某种社群,点击关注,加为好友,成为粉丝。每个人似乎都拥有了更大的自主能力,拥有设置议题的权力,但是很多时候,议题本身并不够专业,也没有传统媒体那样的把关人,导致各种信息芜杂,不知所云,又不知所踪。
最要命的是,因为本来就是按照“人以群分”的规则聚集到一起的,因此,在同一个议题中,越是持相同观点的人,越是抱得紧密,同时也越是排斥不同的意见。没有社交媒体的时候,即便是观点相同的人,也不过是散落各处的路人甲乙丙丁。有了社交媒体,这些原本呈原子状自在的个体,一下子汇聚一起,形成一股势力。在观点的传播中,呈现出“马太效应”,信某个观点的,更加坚信;不信的,反对的更加彻底。
这让理性、客观、清醒,面临更大的实现难度,真实世界看上去越来越像近在咫尺,实际上已经渐行渐远。
还有比这更糟糕的。
社交媒体毕竟还是你主动找上门去,算法时代的信息推送,则让人被动地陷入自我投射的虚幻世界。
比如,我是周星驰多年的死忠粉,甚至连当年的毕业论文也要向他致敬。有一阵我发现,这个世界上居然有那么多跟我一样,把星仔当作星爷供奉的人,因为只要打开XX头条的App,就会有连篇累牍的相关视频,视频下面的评论,一堆人把崇敬之情当作泛滥黄河、连绵江水。类似的是,我的一位酷爱羽毛球运动的同事,也真诚地认为,喜欢这项运动的人,简直数不胜数。
作为一个技术盲的文科生,直到有一天被大神点拨才幡然醒悟,原来我是中了“算法”的道。算法时代,传统的新闻把关人被一套由程序员编写的算法替代。这套算法的原则、目标和手段都只有四个字——投其所好。它会根据你表现出来的蛛丝马迹,推断“你可能喜欢”的东西,然后使劲给你推送,形成一个“信息茧房”。你沉溺其中,很享受,很惬意,然后就很容易以为这就是真实的世界。实际上,你已经把观点相异的言论,以及你不太感兴趣但又客观存在的其他事物,挡在视线之外。
由德国语言协会评出的德国2016年度热词为“后真相”(postfaktisch),这同牛津词典公布的“2016年度英文词汇”——“后真相”(Post-truth)——不谋而合,根据德国语言协会的解释,“后真相”指的是,客观事实对公众观点的影响要小于人们本身的主观感受和个人信念。换句话说,比起基于新闻事实引发的个人思考,人们更愿意从主观臆断去“重塑”甚至“扭曲”新闻事实。
算法,为你呈现了一个内心偏爱但却虚幻的世界,它为“后真相”大行其道,又添了一把柴。
四
如果仅仅如此,还不是最可怕的。如果你了解到下面这则新闻,可能你会更加心惊胆战。
近日英国媒体披露,美国富豪罗伯特•默瑟尔利用大数据分析,帮助特朗普赢得大选,并在英国脱欧中发挥“关键作用”。如果属实,这就意味着,2016年,两只世界级的“黑天鹅”,其实是人工“饲养”的。
英国《观察家报》的报道称,在美国总统大选和英国脱欧公投中,默瑟尔旗下的“剑桥分析”(Cambridge Analytica)公司,利用先进科技,在脸谱等社交网络上搜集摇摆选民的信息,并利用人工智能对其进行分析,寻求能够影响这些人的“情感因素”。他们将这些信息提供给自己支持的阵营,后者根据这些信息,向选民发送“定制”广告,以影响他们的选票去向。
报道称,特朗普的竞选团队曾向该公司支付600多万美元。英国《每日邮报》称,“剑桥分析”公司首席执行官亚历山大•尼克斯早前毫不讳言地表示:“很高兴,我们革命性的数据沟通方式,在特朗普的胜利中发挥了不可或缺的作用。”
此外,“剑桥分析”也为英国脱欧组织“脱离欧盟”(Leave.EU)提供摇摆选民信息,后者据此建立了一个包含一百万人信息的数据库。“脱离欧盟”的公关负责人威格莫尔对《观察家报》表示,“剑桥分析”的信息收集技术及收集信息的程度“令人毛骨悚然”。
可怕吗?如果仅仅是我们自己变得闭塞、狭隘些,可能也只能怪我们自己。然而现在,大数据正在分析并且利用我们的闭塞和狭隘,为我们量身定制一个所谓的“外部世界”,让我们服服帖帖地跟着别人的指挥棒走,却还以为是自己做出的明智选择。
五
是不是只能劝自己好自为之了呢?
好像还真的没有什么管用的办法,毕竟人类进化到今天,那么不容易。
只是,这多少又勾起我对洪荒年代的遐想,想念那种赤裸裸真实的世界。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29