京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代,我们越来越以为外面的世界是真实的.....
遥想洪荒年代,有时候觉得,那会也是蛮好的,一切都赤裸裸的真实。
土地赤裸裸的真实,没有化肥加持;河流赤裸裸的真实,没有杂质;植物赤裸裸的真实,没有农药帮着祛除虫害;天空赤裸裸的真实,没有雾霾……
当然,“人”也赤裸裸的真实,从内到外。
在学习独立行走、打磨石器的过程中,“人”们的大脑日益发达,交流的方式,已经不再满足于用手势比活,或是挤眉弄眼地咿咿呀呀。语言的产生,随之水到渠成。
语言当然只是一种媒介,它离不开说话的“人”。那会,连土制的扩音设备也没有,所以,即便一个“人”嗓门再大,传播所及也很寥寥。交流,只能面对面口耳相传。
“人”变成了人,变得愈发聪明。拿根绳子打个结,或是在树上划上几道,按照事先达成的默契,就能表达或者解读出相关信息。这样,说话的人就不必一脸呆萌地站在原地傻等,别人只要看到他的“留言”,就能知道他想说啥。思想的传递,就此摆脱了对表达主体的物理束缚,传播也就慢慢突破了眼前的一亩三分地,变得更加广泛。
文字的形成,是“结绳记事”的2.0版。从功用来说,它们都实现了对表达主体的解放,但文字进一步减少了交流成本,不仅不用非得留一根打好结的绳子给对方,而且也不至于造成误会,因为你打这种结,本想表示跟他借钱,但在他们那堆人里面,这个结很有可能是表达爱意。文字更加一目了然,而且约定俗成的范围更广。
当然,文字刻在龟背或是竹简上还是有问题。写一封洋洋洒洒的情书给恋人,光搬运竹简就得累个半死,哪还有风花雪月的闲情逸致。所以,纸张和印刷术,又把传播向前推进了一大步,人类在传播上的局限,获得了物理上的突破。
这种突破一直在演进,最后出现了大众媒体。广播延伸了人的耳朵,电视延伸了人的眼睛,在本质上,它们同结绳记事延伸了人的身体是一样的,但更高端,更时尚,更让当时的人不明觉厉。
人类获得的自我解放,传播的发展功不可没。它让原本只能了解“目之所及”世界的人们,能够“听”到更多,“看”到更远,让远在天边的人,真的仿佛近在眼前。不同大陆的人因此有了探索其他大陆的欲望,由此也形成和推动了世界性的交往。
我们超越了“目之所及”,但是从此,那个赤裸裸真实的世界,模糊了,远去了,直至扭曲了。
二
早在20世纪20年代,美国著名政论家李普曼就在其所著的《公众舆论》一书中,首次使用“Pseudo-environment”一词,论及“拟态环境”问题。简单说,就是我们“了解”的世界,并不是真实世界的高保真还原,而是大众媒体为我们描摹出的“世界”。
举个例子说吧。假设你生活的城市,一天中总计发生了100件事。囿于容量有限,媒体需要根据自己的判断和价值观,对这100件事做出取舍,挑出10件来说给你听。再假设,这100件事中,60件是司空见惯的家长里短,30件是“美好人间”类的故事,让人觉得生活还不错,还有10件则是凶杀、盗窃、灾难等等,听着就让人揪心的事情。
媒体会怎么抉择?按照一般原则,那60件稀松平常的事情,媒体是不感兴趣的,先筛掉。在剩下来的40件事情中,媒体可能会优先选择最后10件中的一部分。为什么?其实很正常,尽管西方新闻观和马克思主义新闻观有许多质的不同,但是,“反常性”是被业界公认的新闻价值标准的。除此之外,媒体也会在那30件中挑选一些,因为人们也会喜欢“童话故事”。
那么好了,假设媒体尽最大诚意保持专业精神,挑选了30件令人高兴的事情当中的5件,以及10件令人悲伤的事情当中的5件,好事和坏事的比例是5:5(事实上,许多媒体是不会遵从这个比例的,它们对“坏事”的报道兴趣远胜过“好事”)。
看上去,还是挺平衡的吧?那么,你会因此对你生活的这个城市形成什么印象呢?
简单化地推断,你可能会认为这个城市喜忧参半,但是鉴于人们对于危险更为重视,印象更加深刻,所以你实际上会认为这个城市实在太糟糕了,竟然这么乱。
现在应该清楚了,你对这个城市,并不是按6:3:1的比例形成总体印象,尽管那才是城市的本来面目。
前几天,《人民日报》的小伙伴写了一篇介绍香港的文章,就是这种情况。
这还仅仅是一个城市,我们对自己的生活的城市至少还有不少直观的认知。推而广之,如果是别的城市、别的国家、别的大陆,这样的认知偏差还会更大。
其实历史也是一样。历史是一个无法确认起点的隧洞。我们发现了的各种文物、史料,如同一根根蜡烛,照亮了它周边的区域,但并不能让整个隧洞都灯火通明。我们把一点点烛光串起,勉强把烛光照射到的地方,连缀成历史。那些没有烛照的地方,就成了历史的黑洞。
所以我们了解的历史,同真实的历史也是不一样的。
回到现实。客观地说,“拟态环境”跟媒体有关,但不能怪媒体。
媒体每天向我们输送各种信息,让我们可以突破信息采集器官的局限,了解遥不可及的外部世界是个什么样子。在不可能做到事事都眼见为实的情况下,我们就必须在了解更多外部世界同把握世界真实之间做出选择。
前者显然占据上风,而媒体就承担了这个重任。
但是,对真实世界的探求,不仅是必须的,也是必要的。做到这一点,一来需要媒体“良心”,能够公正、客观、真实的反映现实,不仅是单个事实的真实,还要能通过这些单个事实,反映世界的整体和本质;二来需要人们自己的“理性”,能够在纷繁复杂的信息海洋中,作出合规律性的判断,不被各种暗藏陷阱的信息蒙蔽。
当然,这两个方面,能够做到任何一个都很难。
三
现在,更难的事情来了。
社交媒体的出现,不仅让媒体的“良心”常常无计可施,也让人们的“理性”面临更大的风险。
虽然也被称为“媒体”,但是社交媒体(social media)和传统意义上的大众媒体还是存在显著不同。过去,大众媒体有一个引以为傲的能力,就是议题设置。我不能左右这个世界发生什么,但我能左右你关注什么。这种能力,某种意义上说,正是人们对外部世界的理解产生偏差的“罪魁祸首”。
社交媒体则让用户享有了更多的选择权利和编辑能力,人们自发集结成某种社群,点击关注,加为好友,成为粉丝。每个人似乎都拥有了更大的自主能力,拥有设置议题的权力,但是很多时候,议题本身并不够专业,也没有传统媒体那样的把关人,导致各种信息芜杂,不知所云,又不知所踪。
最要命的是,因为本来就是按照“人以群分”的规则聚集到一起的,因此,在同一个议题中,越是持相同观点的人,越是抱得紧密,同时也越是排斥不同的意见。没有社交媒体的时候,即便是观点相同的人,也不过是散落各处的路人甲乙丙丁。有了社交媒体,这些原本呈原子状自在的个体,一下子汇聚一起,形成一股势力。在观点的传播中,呈现出“马太效应”,信某个观点的,更加坚信;不信的,反对的更加彻底。
这让理性、客观、清醒,面临更大的实现难度,真实世界看上去越来越像近在咫尺,实际上已经渐行渐远。
还有比这更糟糕的。
社交媒体毕竟还是你主动找上门去,算法时代的信息推送,则让人被动地陷入自我投射的虚幻世界。
比如,我是周星驰多年的死忠粉,甚至连当年的毕业论文也要向他致敬。有一阵我发现,这个世界上居然有那么多跟我一样,把星仔当作星爷供奉的人,因为只要打开XX头条的App,就会有连篇累牍的相关视频,视频下面的评论,一堆人把崇敬之情当作泛滥黄河、连绵江水。类似的是,我的一位酷爱羽毛球运动的同事,也真诚地认为,喜欢这项运动的人,简直数不胜数。
作为一个技术盲的文科生,直到有一天被大神点拨才幡然醒悟,原来我是中了“算法”的道。算法时代,传统的新闻把关人被一套由程序员编写的算法替代。这套算法的原则、目标和手段都只有四个字——投其所好。它会根据你表现出来的蛛丝马迹,推断“你可能喜欢”的东西,然后使劲给你推送,形成一个“信息茧房”。你沉溺其中,很享受,很惬意,然后就很容易以为这就是真实的世界。实际上,你已经把观点相异的言论,以及你不太感兴趣但又客观存在的其他事物,挡在视线之外。
由德国语言协会评出的德国2016年度热词为“后真相”(postfaktisch),这同牛津词典公布的“2016年度英文词汇”——“后真相”(Post-truth)——不谋而合,根据德国语言协会的解释,“后真相”指的是,客观事实对公众观点的影响要小于人们本身的主观感受和个人信念。换句话说,比起基于新闻事实引发的个人思考,人们更愿意从主观臆断去“重塑”甚至“扭曲”新闻事实。
算法,为你呈现了一个内心偏爱但却虚幻的世界,它为“后真相”大行其道,又添了一把柴。
四
如果仅仅如此,还不是最可怕的。如果你了解到下面这则新闻,可能你会更加心惊胆战。
近日英国媒体披露,美国富豪罗伯特•默瑟尔利用大数据分析,帮助特朗普赢得大选,并在英国脱欧中发挥“关键作用”。如果属实,这就意味着,2016年,两只世界级的“黑天鹅”,其实是人工“饲养”的。
英国《观察家报》的报道称,在美国总统大选和英国脱欧公投中,默瑟尔旗下的“剑桥分析”(Cambridge Analytica)公司,利用先进科技,在脸谱等社交网络上搜集摇摆选民的信息,并利用人工智能对其进行分析,寻求能够影响这些人的“情感因素”。他们将这些信息提供给自己支持的阵营,后者根据这些信息,向选民发送“定制”广告,以影响他们的选票去向。
报道称,特朗普的竞选团队曾向该公司支付600多万美元。英国《每日邮报》称,“剑桥分析”公司首席执行官亚历山大•尼克斯早前毫不讳言地表示:“很高兴,我们革命性的数据沟通方式,在特朗普的胜利中发挥了不可或缺的作用。”
此外,“剑桥分析”也为英国脱欧组织“脱离欧盟”(Leave.EU)提供摇摆选民信息,后者据此建立了一个包含一百万人信息的数据库。“脱离欧盟”的公关负责人威格莫尔对《观察家报》表示,“剑桥分析”的信息收集技术及收集信息的程度“令人毛骨悚然”。
可怕吗?如果仅仅是我们自己变得闭塞、狭隘些,可能也只能怪我们自己。然而现在,大数据正在分析并且利用我们的闭塞和狭隘,为我们量身定制一个所谓的“外部世界”,让我们服服帖帖地跟着别人的指挥棒走,却还以为是自己做出的明智选择。
五
是不是只能劝自己好自为之了呢?
好像还真的没有什么管用的办法,毕竟人类进化到今天,那么不容易。
只是,这多少又勾起我对洪荒年代的遐想,想念那种赤裸裸真实的世界。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27