京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据时代知识的停止点_数据分析师考试
毫无疑问,信息超载作为一种生活方式,已经挟裹着众生的生活。戴维·温伯格《知识的边界》所尝试的,恰是在大数据时代,如何认知网络下的知识与科学。因为,不管确定“互联网+”,还是定义“互联网-”,都要面对今日“事实不再是事实”,而“专家随处可见”的现实。
显然需要理清思路,理性面对这一切。你要学会像戴维一样,冷静地打着比方,包括以转述的方式,向自己的见解缓步、轻松而去——
美国出版公司兰登书屋的创始人之一贝内特·瑟夫出版的一本书里就讲过这么个奇闻轶事:
一天,《哈波斯》杂志的卡斯·坎菲尔徳在编辑部接待一位长相甜美却个性坚决的妇女。这位女同胞很想讨论她自己正在创作的第一本小说。“一本小说应该是多长的篇幅?”她问道。
“这个问题没有确切的答案,”坎菲尔德解释道,“一些像《伊登·弗洛姆》这样的小说,大概只有4万字。而其他的小说,如《飘》,却可能达到30万字。”
“但,普通小说的平均长度大概是多少字?”妇女坚持问道。
“呃,我觉得大概是8万字吧。”坎菲尔德回答。
妇女跳了起来,并欢呼着。“感谢上帝!”她喊道。“我的小说完结了!”
戴维转述这则逸闻并不是让大家简单地笑上一笑。戴维想说的是,面对太多的信息而无法全部知道的事实,其实我们的战略一直是建立一个知识的停止点(stopping points)系统。这是个很有效的方法,很实用于保存和交流知识的纸质媒介。
戴维列举的另一伟大实例同样能说明问题。1836年,达尔文从“小猎犬号”航行归来,完成了将促进他进化论理论的观察。1838年,达尔文对自己的理论有了清晰的想法。1842年,他用铅笔写下了35页的“骨架”,但没有公开。1844年,他写了189页的手稿,没有公开,但指示妻子,如果他死了就将手稿出版。接下来的15年,他研究了藤壶,出版了8本书,生了9个孩子,并且经常和同事通信往来讨论。他还开始了实验科学。但他就是没有出版自己的进化论。他似乎在等着什么?有一天他收到了年轻的博物学家阿尔弗雷德·罗素·华莱士写来的一封信,此后华莱士又寄给了达尔文一份20页的文稿,里面提到的理论和达尔文的进化论基本相似。达尔文万分惊讶,他想成为这个理论的最早提出者,但不想欺骗华莱士,或者怕更为糟糕,让自己看起来是窃取了华莱士的观点。在听取两位亲密同事意见后,1858年7月,伦敦林奈学会安排宣读了华莱士的一篇文章,以及达尔文的两篇文章。林奈学会在自己的杂志上刊发这些文稿后,达尔文才开始在科学家圈内引起关注。这个鼓舞,让达尔文经过13个月的写作,完成了不朽的《物种起源》。达尔文和华莱士的故事,后世有多种解读。纸质出版模式静静地塑造了科学,这是一个例子。同时,那个停止点,格外清晰。
传统的知识是纸的意外产物。没有什么时候,我们对纸的认识这么明确过。纸上的知识,纸上的科学,曾经是一种出版的类型,它们经过层层过滤,才能在纸上“行走江湖”。但今天,纸质悄然换作网络。在此背景下,如有达尔文和华莱士的故事上演,恐怕要重新演绎,且绝不会如此安安静静,按部就班,起承转合。
能够明确的是,权威在网络化时代仍然会是一个停止点,但“权威已经不再是一个主要由有资质的人所构成、专门生产特级产品的特殊阶层了”。相反,权威更多地是由功能性来定义,如你的体验一般:权威是你在无数连接中访问的那个最后一个页面——是你决定不再继续去点击其他链接的那个页面。
正如戴维所打的比方一样:当知识变得网络化之后,房间里最聪明的那位,已经不是站在屋子前头给我们上课的那位,也不是房间里所有人的群体智慧。房间里最聪明的人,是房间本身:是容纳了其中所有的人与思想,并把他们与外界相联连的这个网。换句话说,互联网作为知识的基础设施,本身并不拥有创造知识的实体要件,知识不存在于书籍之中,也不存在于头脑之中,而是存在于网络本身。
以下事实正越来越清晰:传统的图书在表达观点的方式和呈现形态上,是将思想挤压到一条狭长的小径上,驱使读者沿着这条小径行进。网络化时代,从最为纯正的网络意义上,它的开放姿态,决定每个人都遭遇了网络所带来的心理颠覆——丰富性、链接、无需许可、公共性、未决性,但网络化的知识和科学,会让我们更加接近关于知识和科学的真理。但就在这浩若烟海之中,我们一样要找到知识的停止点,在心里给它个飞吻。
网络,如尼古拉斯·卡尔说的那样,重装了我们的大脑。在信息洪流之中,众生得以不必焦虑,并能轻松自在地在网络之上“笑傲江湖”的方式,或许是找到那一个个知识的停止点。从这个意义上,我们要再回看一下本文开始时戴维·温伯格转述的故事,大笑三声,一起释怀。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21