
维基社区的成员构成依然是现实世界权力构成的体现。“人人可编辑的自由百科全书”并未兑现去中心化的平等承诺。维基百科并不比其它百科全书更不可靠,但也并没有更可靠。
维基百科(wikipedia)常被视作技术与网络改变世界的例证。它和Facebook、Twitter、YouTube一起被奉为大数据时代Web 2.0技术之“用户创造内容”模式的完美展现。
然而这曾被誉为“人人可编辑的自由百科全书”的大热网站,近年来呈现出无可挽回的颓势。早年间维基的词条数目曾有“指数级增长”,但如今持续减缓。而活跃编辑者——即每月登录并进行至少5次编辑的用户——大幅减少对维基百科和维基社区更是筋骨之伤。相比2007年最高峰,目前所有语言版本维基百科的活跃编辑者减少了20%,英文版更是减少了40%。2010年以来,维基媒体基金会每年的年度计划中都把“提升编辑参与度”列为重点,但到目前为止,这方面的努力只能说是屡败屡战。
维基百科最初的成功更像是一个意外,而非精心筹划的结果
众所周知,2006至2007年是维基百科发展最快的时期,也是整个社交媒体和Web 2.0兴起并广受吹捧的时期。在《维基经济学》一书中,2006年被描绘成社交媒体和Web 2.0全面战胜传统的Web 1.0模式并重塑互联网的一年。作者预言,去中心化的协作将彻底取代传统的、集中的组织和生产模式,并全面改变人类在科研、文化、教育等领域的活动。
如今,在基本架构和网络化协作的逻辑并未改变的情况下,维基百科2007年之后增长势头却一路下滑。Web 2.0何以失灵了?
其实,早在“Web 2.0”被提出时,就有人质疑这一概念只是个噱头。因为对照被追封为Web 1.0时代的互联网,Web 2.0并没有技术方面的根本革新。一些被拉入Web 2.0旗下的所谓创新,诸如反馈/互动机制等等,在Web 1.0时代也已存在。Web 2.0与Web1.0之间很难找到清晰的界限。
其次,无论是“协作式生产”还是建立“人类所有知识库”的尝试,都早在当代之前即已存在。“协作式生产”甚至并非人类独有技能。在历史学者们眼中,许多初看似乎新奇的想法往往比我们认为的要古老得多。从亚历山大图书馆到《永乐大典》,从狄德罗的《百科全书》到英国科幻小说家赫伯特 乔治 威尔斯在1930年代设想的利用最新科技打造“永久的世界百科全书”——集结世间所有知识的梦想和尝试从未间断。而如此规模的工作自然也都是以协作的方式完成的。比如狄德罗《百科全书》的编辑就来自不同社会阶层,有着不同的职业、性别和宗教信仰,有医生、律师、军官,甚至政府官员。
抛开Web 2.0的标签,我们就会发现那些网站的兴起和衰落都是诸多因素合力的结果。软硬件及部署成本的下降,世纪初互联网泡沫破灭之后随着市场信心逐步恢复的投资复苏,移动设备的兴起以及各类简单易用的分享软件的出现,都是社交网络服务的发展所必不可少的。具体到维基百科,除了上述大环境,还有来自创始人吉米 威尔士早期创业的资金、业已存在的维基软件、乃至之前Nupedia项目的失败,都为维基百科的建立和发展提供了必需的条件。
事实上,维基百科最初的成功更像是一个意外,而非精心筹划的结果。但当人们事后将它和同时期兴起的许多互联网服务并置一处考察时,去中心化的协作作为它们共有的“创新”模式凸现出来了,而其他同样重要的因素却因过于“传统”而被忽视。Web 2.0像是一面高高飘扬的大旗,指引着人们在回顾某个时期某些网站发展时关注宏大叙事,却忽视了这些网站各自不同的个体发展经历,以及那些看似平庸无趣但实际发挥作用的推动力量。
去中心化与平等参与只是传说
凭借大数据时代的技术,维基百科无疑能比历史上所有百科项目吸纳更广泛的参与者。只是,这种“广泛”与人们理想中的高度协作、无论背景人人平等参与、使用者即编辑者的愿景相差多少呢?
以英文版维基百科为例,虽然注册用户数量庞大,但实际进行过编辑的用户不足2%,三分之一的内容来自于不到0.05%的贡献者。而真正的核心用户数量更少。目前“高度活跃编辑者”——指最近一个月进行过至少100次编辑的用户——数量约为3000人,这些人被认为才是真正的维基社区的构成者。而 “活跃编辑者”和“高度活跃编辑者”合计仅占用户总数的0.02%~0.03%。
此外,有人认为还存在一个更小的内部核心圈,由包括创始人吉米 威尔士在内的数百人构成。这些人在现实中彼此相识,会一起参加线下活动。据称,维基百科上大部分的新词条都是由这个小规模的核心圈子建立的。
然而,即便是活跃用户对维基词条的编辑,也远非“所有人参与编辑所有内容”的完全去中心化形式。的确,Web 2.0模式所代表的信息技术能让人们摆脱现实中地理、国籍等诸多限制,在虚拟空间按照自己的兴趣重新组合。这反映在维基社区便是按照内容主题进一步细分而成的更小群组,这些群组专注于各自的兴趣和题目,形成一个个小圈子,彼此之间却极少沟通和合作。一些生僻冷门的内容甚至只有几个人参与编写。这样的词条当然也可作参考,但这在多大程度上符合我们对于百科全书的理解?又能在多大程度上符合维基百科所主张的客观中立的标准?
可见,所谓人人“皆可”参与的机会和理念并没有带来人人“皆已”参与的结果。这或许并非维基协作模式本身的问题,而是因为所有技术都无法摆脱现实因素的影响。
比方说,作为一个在线协作项目,维基百科的编辑者首先需要有一台连接到互联网的电脑,并具备一定的电脑使用技能。这听起来像是废话。但在全球范围内,因为经济、政治、文化、教育等因素导致的技术普及的不均衡是实际存在的,而由这种不均衡和其他各种原因所造成的某些群体话语的缺席对于维基百科所推崇的广泛参与、平等协作、客观中立无疑是一个阻碍。
尽管目前维基百科有287个语言版本,但英文版的规模、用户数量和完善程度都远超其他任何一种语言版本,许多母语非英语的人也以英文版维基百科为首选参考。这本身便是现实世界中政治经济和文化实力对比的体现。据观察,在英文版维基百科上,主要编辑者中绝大部分是男性、美国人、精通电脑、年龄在 30岁上下。而最新的调查则显示,在英文版维基百科的所有编辑者中,男性占 84%~91%;20%的编辑者来自美国,编辑人数最多的十个国家中,除印度(占3%)外都是欧洲和北美国家;年龄方面,近60%的编辑者介于17至40 岁之间。
维基百科的贡献者乐于分享,相信信息应当自由流通,并更愿意在网络上展现真实自我。然而分享主义者是否就比独享主义者更有知识和发言权?同样,男性相对于女性、欧美人相对于其他地区的人、“电脑专家”相对于“电脑文盲”,这些维基社区的参与者背景对于维基百科内容的可靠性和共识性意味着什么?
以上这些并不是要否定维基百科的成就。如前所述,维基社区的成员构成是现实世界权力构成的体现,而维基百科编辑者的背景分布也被认为与当今学术界的现状相似。换言之,维基百科并不比其他百科全书更不可靠,但也并没有更可靠。这本身或许并不是一个问题,但却让我们看到维基社区所梦想和宣扬的理想以及对所谓Web 2.0的创新与革命力量的期待确实过于乐观和简单化了。
在智能移动设备上如何编辑百科?
维基百科陷入发展瓶颈的复杂原因中还有不容忽视的一点:在线协作所依赖的技术环境在这些年里也发生了变化。
维基百科创立的2001年,计算机已在发达国家迅速普及,这无疑有助于普通用户,尤其是主要编辑群体的参与。而就在维基百科增长巅峰的2007 年,智能移动设备革命开始了。这对维基百科来说却并非好事。移动用户的需求、使用习惯、关注点可能都与桌面设备用户不尽相同。同样是Web 2.0时代的引领者,Facebook和Twitter在移动革命中的获益与维基百科形成鲜明对比。智能手机让人们可以随时随地阅读和发布碎片式信息,但维基百科所提供的大篇幅内容和所需的编辑工作则显然是另一码事。
如今,维基媒体基金会正努力赶上智能移动平台的发展脚步。不过,改善用户在手机或平板设备上的体验或许还不是最具挑战性的,接下来,他们要如何吸引用户在可穿戴设备如眼镜和手表上阅读和编辑百科词条呢?
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01