京公网安备 11010802034615号
经营许可证编号:京B2-20210330
千万不要被大数据洗脑和挟持
钱钟书先生写过一篇妙文,说从整个历史来看,古代其实相当于人类的小孩子时期,先前是幼稚的,经过了千百年的长进,慢慢才到了现代。时代越是古旧,它的历史就越短,时代越是在后,它积累的阅历越是深厚,年龄就越多。所以,总结来说,我们反而是我们祖父的前辈,上古三代反不如现代悠久古老。
现代人完全可以这样对待我们的历史和传统。我们的时代正在用这样的一种方式瓦解经典,时间再也不是淘洗作品的永恒标准,因为传统无法解释现代人的经验,历史也无法应对高速变化的现实,共识已经瓦解成了个人主义的炮灰,经典备受质疑,经典之中也许并无圣人之言,很可能都是无用的废话——如果按照现如今大数据的标准,所有的经典都应该抛弃在垃圾堆,因为其中撰写的都是无用之言和可疑之言,缺乏合理的大数据的论证。
这话说得有些滑稽,但确实是切中要害的现实概括:大数据神话正在横扫一切领域。原本我们以为大数据只能在科学等实证领域兴风作浪,后来才发现,大数据神话的野心是掌控一切现实,就连人文学科,也同样需要大数据的支撑,没有大数据支撑的文章都是耍流氓。以前,我们写文章会习惯性地写,苏格拉底说过,未经省察的人生是不值得过的。现在写作就会说,根据统计数据显示,或者根据某份权威的调查报告的统计数字,未经省察的人生幸福指数只有20%-40%左右。我们时代最流行的阅读是别人替你读书,把书的内容划重点,归纳和总结出各种所谓的“干货”和教条,然后塞给你,你马上就觉得自己变成了博学多知的百科全书——这就是现在“逻辑思维”正在推广的学习方式。我们渴望的知识不再是经过时间的淘洗依然存在的经典,我们最想获得的知识是维基百科。
按照现在最时髦的理论——其实就是流行的《未来简史》《大数据时代》之类通俗读物——人类所有的知识都可以归纳为某种算法。比如在中世纪,获得知识的公式是:知识=经文 逻辑。简单说就是,如果你先想要知道某个问题的答案,中世纪的人会阅读相关经文,然后用中世纪逻辑来理解经文的确切含义。
而进入了科学革命时代之后,这个算法的公式就是:知识=实证数据 数学。以地球的形状为例,我们就要搜集相关的实证数据,观察太阳、月亮和行星,积累了足够的观测值,再用数学工具加以分析,利用三角学进行推断。
很显然,以上的两个公式就算是正确的,帮助我们解决了很多问题,但仍然具有很大的缺陷,它无法处理我们的人生价值和意义问题。所以,某些以创造公式为己任的人,又费尽脑汁创造了一个获得伦理知识的公式:知识=体验 敏感性。就是说,如果我们想知道任何道德问题的答案,我们需要连接到自己的内心体验,并以最大的敏感性来观察它。
但是这个就很模糊了,体验不能用数据测量,敏感性更是无迹可循,唯一依靠的只有自己的感觉。如何对自己的感觉进行量化,或者用流行的大数据进行统计呢?如果这些都属模糊的数据,这种知识如何获得?所以在伦理学领域,或者在我们寻找人生意义的问题上,无法用一个统一的公式获得共识——幸好如此,否则我们都利用这种算法计算我们的感受,那人生还有什么意外的乐趣?
我不知道大数据时代到来对生活影响有多大。我只知道,任何数据都无法解决我人生各个阶段的意义,更无法解决抑郁、自杀、快乐、苦闷等情绪上的问题。换句话说,千万不要被大数据洗脑和挟持,我们不是大数据的人质,大数据应该是我们解决某种问题的方式。好像在每一个时代都会有这样一个走火入魔的时期,我们有上帝和神学统治一切的时期,然后是启蒙理性统治的时代,现在是大数据时代。但它们都不能成为简化人生的公式和算法。就算人工智能可以使用各种算法赢得未来,就算机器战胜了人的大脑,它只能说明人类的大脑比机器聪明,而不是相反,更不会让我们对其顶礼膜拜。对我们而言,无论是人工智能,还是大数据,它们只能成为人类寻找生命意义的工具,而不是目的。它们代替不了人类的未来。
试读
那些被认为内向的人经常会提到,比起面对多个人,他们在一对一的交谈中感觉更自在。别人也认为他们是很棒的聆听者,因为他们更注重谈话深度,而不是广度。通常情况下关键就在于开启对话的方式。你可以从一个小话题开始,询问别人的名字,或者问问他们是否有小孩或者宠物,用一些活跃气氛的话语开始交谈。一旦你找到对方深有所感的兴趣点或者关注点,谈话就会自然而然地展开。
——珍妮弗·康维勒
《内向者沟通圣经》
说到底,自己现在几岁了?连这都不清不楚。不,即使计算,也可想而知。自己度过的每一天,跟牛皮纸一样薄,没有厚度。那种东西,管他叠上多少张,都厚不到哪儿去吧。一分和一秒差不多了。一回神,往往一两个小时已经过去。那么十年、百年应该也差不到哪儿去。既然如此,算了也白算。——[日]京极夏彦
《百鬼夜行 阳》
散步这件事——我认为是人类的日常中最自然的行为,同时,也有很重要的意义。此外,散步这一行为是否具有目的性,也是值得考虑的一点。
散步是件非常自由的事。没有目的地的条件限制,也没有时间的束缚。而且,走路的步调及速度都是自由的,还讲究心情闲适。散步时,偶尔的立足停顿也是必需的。
——[日] 谷口治郎
《散步去》
中国人讲“情”,跟“爱”又不一样,“情”好像是宇宙的一种原动力,一切的发生就靠这个“情”字,它比那个“爱”字深广幽微。曹雪芹是用一个宇宙性、神话性的东西来说这个“情”字,“情”字还不够,还有“情根”,情一生根,麻烦了!《牡丹亭》里面有句话:“情根一点是无生债。”情一生根以后这个债就还不完了。
——白先勇
《白先勇细说红楼梦》
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-10在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-10在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09在数据可视化领域,折线图是展示时序数据、趋势变化的核心图表类型之一,其简洁的线条的能够清晰呈现数据的起伏规律。Python ECh ...
2026-04-09在数据驱动的时代,数据分析早已不是“凭经验、靠感觉”的零散操作,而是一套具备固定逻辑、标准化流程的系统方法——这就是数据 ...
2026-04-09长短期记忆网络(LSTM)作为循环神经网络(RNN)的重要改进模型,凭借其独特的门控机制(遗忘门、输入门、输出门),有效解决了 ...
2026-04-08在数据分析全流程中,数据质量是决定分析结论可靠性的核心前提,而异常值作为数据集中的“异类”,往往会干扰统计检验、模型训练 ...
2026-04-08在数字经济飞速发展的今天,数据已渗透到各行各业的核心场景,成为解读趋势、优化决策、创造价值的核心载体。而数据分析,作为挖 ...
2026-04-08在数据分析全流程中,数据处理是基础,图形可视化是核心呈现手段——前者负责将杂乱无章的原始数据转化为干净、规范、可分析的格 ...
2026-04-07在数据分析与统计推断中,p值是衡量假设检验结果显著性的核心指标,其本质是在原假设(通常为“无效应”“无差异”)成立的前提 ...
2026-04-07在数字经济深度渗透的今天,数据已成为企业生存发展的核心资产,企业的竞争本质已转变为数据利用能力的竞争。然而,大量来自生产 ...
2026-04-07Python凭借简洁的语法、丰富的生态库,成为算法开发、数据处理、机器学习等领域的首选语言。但受限于动态类型、解释性执行的特性 ...
2026-04-03在深度学习神经网络中,卷积操作是实现数据特征提取的核心引擎,更是让模型“看懂”数据、“解读”数据的关键所在。不同于传统机 ...
2026-04-03当数字化转型从企业的“战略口号”落地为“生存之战”,越来越多的企业意识到,转型的核心并非技术的堆砌,而是数据价值的深度挖 ...
2026-04-03在日常办公数据分析中,数据透视表凭借高效的汇总、分组功能,成为Excel、WPS等办公软件中最常用的数据分析工具之一。其中,“计 ...
2026-04-02在数字化交互的全场景中,用户的每一次操作都在生成动态的行为轨迹——电商用户的“浏览商品→点击详情→加入购物车”,内容APP ...
2026-04-02在数字化转型深度推进的今天,企业数据已成为驱动业务增长、构建核心竞争力的战略资产,而数据安全则是守护这份资产的“生命线” ...
2026-04-02在数据驱动决策的浪潮中,数据挖掘与数据分析是两个高频出现且极易被混淆的概念。有人将二者等同看待,认为“做数据分析就是做数 ...
2026-04-01