京公网安备 11010802034615号
经营许可证编号:京B2-20210330
千万不要被大数据洗脑和挟持
钱钟书先生写过一篇妙文,说从整个历史来看,古代其实相当于人类的小孩子时期,先前是幼稚的,经过了千百年的长进,慢慢才到了现代。时代越是古旧,它的历史就越短,时代越是在后,它积累的阅历越是深厚,年龄就越多。所以,总结来说,我们反而是我们祖父的前辈,上古三代反不如现代悠久古老。
现代人完全可以这样对待我们的历史和传统。我们的时代正在用这样的一种方式瓦解经典,时间再也不是淘洗作品的永恒标准,因为传统无法解释现代人的经验,历史也无法应对高速变化的现实,共识已经瓦解成了个人主义的炮灰,经典备受质疑,经典之中也许并无圣人之言,很可能都是无用的废话——如果按照现如今大数据的标准,所有的经典都应该抛弃在垃圾堆,因为其中撰写的都是无用之言和可疑之言,缺乏合理的大数据的论证。
这话说得有些滑稽,但确实是切中要害的现实概括:大数据神话正在横扫一切领域。原本我们以为大数据只能在科学等实证领域兴风作浪,后来才发现,大数据神话的野心是掌控一切现实,就连人文学科,也同样需要大数据的支撑,没有大数据支撑的文章都是耍流氓。以前,我们写文章会习惯性地写,苏格拉底说过,未经省察的人生是不值得过的。现在写作就会说,根据统计数据显示,或者根据某份权威的调查报告的统计数字,未经省察的人生幸福指数只有20%-40%左右。我们时代最流行的阅读是别人替你读书,把书的内容划重点,归纳和总结出各种所谓的“干货”和教条,然后塞给你,你马上就觉得自己变成了博学多知的百科全书——这就是现在“逻辑思维”正在推广的学习方式。我们渴望的知识不再是经过时间的淘洗依然存在的经典,我们最想获得的知识是维基百科。
按照现在最时髦的理论——其实就是流行的《未来简史》《大数据时代》之类通俗读物——人类所有的知识都可以归纳为某种算法。比如在中世纪,获得知识的公式是:知识=经文 逻辑。简单说就是,如果你先想要知道某个问题的答案,中世纪的人会阅读相关经文,然后用中世纪逻辑来理解经文的确切含义。
而进入了科学革命时代之后,这个算法的公式就是:知识=实证数据 数学。以地球的形状为例,我们就要搜集相关的实证数据,观察太阳、月亮和行星,积累了足够的观测值,再用数学工具加以分析,利用三角学进行推断。
很显然,以上的两个公式就算是正确的,帮助我们解决了很多问题,但仍然具有很大的缺陷,它无法处理我们的人生价值和意义问题。所以,某些以创造公式为己任的人,又费尽脑汁创造了一个获得伦理知识的公式:知识=体验 敏感性。就是说,如果我们想知道任何道德问题的答案,我们需要连接到自己的内心体验,并以最大的敏感性来观察它。
但是这个就很模糊了,体验不能用数据测量,敏感性更是无迹可循,唯一依靠的只有自己的感觉。如何对自己的感觉进行量化,或者用流行的大数据进行统计呢?如果这些都属模糊的数据,这种知识如何获得?所以在伦理学领域,或者在我们寻找人生意义的问题上,无法用一个统一的公式获得共识——幸好如此,否则我们都利用这种算法计算我们的感受,那人生还有什么意外的乐趣?
我不知道大数据时代到来对生活影响有多大。我只知道,任何数据都无法解决我人生各个阶段的意义,更无法解决抑郁、自杀、快乐、苦闷等情绪上的问题。换句话说,千万不要被大数据洗脑和挟持,我们不是大数据的人质,大数据应该是我们解决某种问题的方式。好像在每一个时代都会有这样一个走火入魔的时期,我们有上帝和神学统治一切的时期,然后是启蒙理性统治的时代,现在是大数据时代。但它们都不能成为简化人生的公式和算法。就算人工智能可以使用各种算法赢得未来,就算机器战胜了人的大脑,它只能说明人类的大脑比机器聪明,而不是相反,更不会让我们对其顶礼膜拜。对我们而言,无论是人工智能,还是大数据,它们只能成为人类寻找生命意义的工具,而不是目的。它们代替不了人类的未来。
试读
那些被认为内向的人经常会提到,比起面对多个人,他们在一对一的交谈中感觉更自在。别人也认为他们是很棒的聆听者,因为他们更注重谈话深度,而不是广度。通常情况下关键就在于开启对话的方式。你可以从一个小话题开始,询问别人的名字,或者问问他们是否有小孩或者宠物,用一些活跃气氛的话语开始交谈。一旦你找到对方深有所感的兴趣点或者关注点,谈话就会自然而然地展开。
——珍妮弗·康维勒
《内向者沟通圣经》
说到底,自己现在几岁了?连这都不清不楚。不,即使计算,也可想而知。自己度过的每一天,跟牛皮纸一样薄,没有厚度。那种东西,管他叠上多少张,都厚不到哪儿去吧。一分和一秒差不多了。一回神,往往一两个小时已经过去。那么十年、百年应该也差不到哪儿去。既然如此,算了也白算。——[日]京极夏彦
《百鬼夜行 阳》
散步这件事——我认为是人类的日常中最自然的行为,同时,也有很重要的意义。此外,散步这一行为是否具有目的性,也是值得考虑的一点。
散步是件非常自由的事。没有目的地的条件限制,也没有时间的束缚。而且,走路的步调及速度都是自由的,还讲究心情闲适。散步时,偶尔的立足停顿也是必需的。
——[日] 谷口治郎
《散步去》
中国人讲“情”,跟“爱”又不一样,“情”好像是宇宙的一种原动力,一切的发生就靠这个“情”字,它比那个“爱”字深广幽微。曹雪芹是用一个宇宙性、神话性的东西来说这个“情”字,“情”字还不够,还有“情根”,情一生根,麻烦了!《牡丹亭》里面有句话:“情根一点是无生债。”情一生根以后这个债就还不完了。
——白先勇
《白先勇细说红楼梦》
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11