京公网安备 11010802034615号
经营许可证编号:京B2-20210330
千万不要被大数据洗脑和挟持
钱钟书先生写过一篇妙文,说从整个历史来看,古代其实相当于人类的小孩子时期,先前是幼稚的,经过了千百年的长进,慢慢才到了现代。时代越是古旧,它的历史就越短,时代越是在后,它积累的阅历越是深厚,年龄就越多。所以,总结来说,我们反而是我们祖父的前辈,上古三代反不如现代悠久古老。
现代人完全可以这样对待我们的历史和传统。我们的时代正在用这样的一种方式瓦解经典,时间再也不是淘洗作品的永恒标准,因为传统无法解释现代人的经验,历史也无法应对高速变化的现实,共识已经瓦解成了个人主义的炮灰,经典备受质疑,经典之中也许并无圣人之言,很可能都是无用的废话——如果按照现如今大数据的标准,所有的经典都应该抛弃在垃圾堆,因为其中撰写的都是无用之言和可疑之言,缺乏合理的大数据的论证。
这话说得有些滑稽,但确实是切中要害的现实概括:大数据神话正在横扫一切领域。原本我们以为大数据只能在科学等实证领域兴风作浪,后来才发现,大数据神话的野心是掌控一切现实,就连人文学科,也同样需要大数据的支撑,没有大数据支撑的文章都是耍流氓。以前,我们写文章会习惯性地写,苏格拉底说过,未经省察的人生是不值得过的。现在写作就会说,根据统计数据显示,或者根据某份权威的调查报告的统计数字,未经省察的人生幸福指数只有20%-40%左右。我们时代最流行的阅读是别人替你读书,把书的内容划重点,归纳和总结出各种所谓的“干货”和教条,然后塞给你,你马上就觉得自己变成了博学多知的百科全书——这就是现在“逻辑思维”正在推广的学习方式。我们渴望的知识不再是经过时间的淘洗依然存在的经典,我们最想获得的知识是维基百科。
按照现在最时髦的理论——其实就是流行的《未来简史》《大数据时代》之类通俗读物——人类所有的知识都可以归纳为某种算法。比如在中世纪,获得知识的公式是:知识=经文 逻辑。简单说就是,如果你先想要知道某个问题的答案,中世纪的人会阅读相关经文,然后用中世纪逻辑来理解经文的确切含义。
而进入了科学革命时代之后,这个算法的公式就是:知识=实证数据 数学。以地球的形状为例,我们就要搜集相关的实证数据,观察太阳、月亮和行星,积累了足够的观测值,再用数学工具加以分析,利用三角学进行推断。
很显然,以上的两个公式就算是正确的,帮助我们解决了很多问题,但仍然具有很大的缺陷,它无法处理我们的人生价值和意义问题。所以,某些以创造公式为己任的人,又费尽脑汁创造了一个获得伦理知识的公式:知识=体验 敏感性。就是说,如果我们想知道任何道德问题的答案,我们需要连接到自己的内心体验,并以最大的敏感性来观察它。
但是这个就很模糊了,体验不能用数据测量,敏感性更是无迹可循,唯一依靠的只有自己的感觉。如何对自己的感觉进行量化,或者用流行的大数据进行统计呢?如果这些都属模糊的数据,这种知识如何获得?所以在伦理学领域,或者在我们寻找人生意义的问题上,无法用一个统一的公式获得共识——幸好如此,否则我们都利用这种算法计算我们的感受,那人生还有什么意外的乐趣?
我不知道大数据时代到来对生活影响有多大。我只知道,任何数据都无法解决我人生各个阶段的意义,更无法解决抑郁、自杀、快乐、苦闷等情绪上的问题。换句话说,千万不要被大数据洗脑和挟持,我们不是大数据的人质,大数据应该是我们解决某种问题的方式。好像在每一个时代都会有这样一个走火入魔的时期,我们有上帝和神学统治一切的时期,然后是启蒙理性统治的时代,现在是大数据时代。但它们都不能成为简化人生的公式和算法。就算人工智能可以使用各种算法赢得未来,就算机器战胜了人的大脑,它只能说明人类的大脑比机器聪明,而不是相反,更不会让我们对其顶礼膜拜。对我们而言,无论是人工智能,还是大数据,它们只能成为人类寻找生命意义的工具,而不是目的。它们代替不了人类的未来。
试读
那些被认为内向的人经常会提到,比起面对多个人,他们在一对一的交谈中感觉更自在。别人也认为他们是很棒的聆听者,因为他们更注重谈话深度,而不是广度。通常情况下关键就在于开启对话的方式。你可以从一个小话题开始,询问别人的名字,或者问问他们是否有小孩或者宠物,用一些活跃气氛的话语开始交谈。一旦你找到对方深有所感的兴趣点或者关注点,谈话就会自然而然地展开。
——珍妮弗·康维勒
《内向者沟通圣经》
说到底,自己现在几岁了?连这都不清不楚。不,即使计算,也可想而知。自己度过的每一天,跟牛皮纸一样薄,没有厚度。那种东西,管他叠上多少张,都厚不到哪儿去吧。一分和一秒差不多了。一回神,往往一两个小时已经过去。那么十年、百年应该也差不到哪儿去。既然如此,算了也白算。——[日]京极夏彦
《百鬼夜行 阳》
散步这件事——我认为是人类的日常中最自然的行为,同时,也有很重要的意义。此外,散步这一行为是否具有目的性,也是值得考虑的一点。
散步是件非常自由的事。没有目的地的条件限制,也没有时间的束缚。而且,走路的步调及速度都是自由的,还讲究心情闲适。散步时,偶尔的立足停顿也是必需的。
——[日] 谷口治郎
《散步去》
中国人讲“情”,跟“爱”又不一样,“情”好像是宇宙的一种原动力,一切的发生就靠这个“情”字,它比那个“爱”字深广幽微。曹雪芹是用一个宇宙性、神话性的东西来说这个“情”字,“情”字还不够,还有“情根”,情一生根,麻烦了!《牡丹亭》里面有句话:“情根一点是无生债。”情一生根以后这个债就还不完了。
——白先勇
《白先勇细说红楼梦》
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Python文件操作场景中,批量处理文件、遍历目录树是高频需求——无论是统计某文件夹下的文件数量、筛选特定类型文件,还是批量 ...
2026-01-05在神经网络模型训练过程中,开发者最担心的问题之一,莫过于“训练误差突然增大”——前几轮还平稳下降的损失值(Loss),突然在 ...
2026-01-05在数据驱动的业务场景中,“垃圾数据进,垃圾结果出”是永恒的警示。企业收集的数据往往存在缺失、异常、重复、格式混乱等问题, ...
2026-01-05在数字化时代,用户行为数据已成为企业的核心资产之一。从用户打开APP的首次点击,到浏览页面的停留时长,再到最终的购买决策、 ...
2026-01-04在数据分析领域,数据稳定性是衡量数据质量的核心维度之一,直接决定了分析结果的可靠性与决策价值。稳定的数据能反映事物的固有 ...
2026-01-04在CDA(Certified Data Analyst)数据分析师的工作链路中,数据读取是连接原始数据与后续分析的关键桥梁。如果说数据采集是“获 ...
2026-01-04尊敬的考生: 您好! 我们诚挚通知您,CDA Level III 考试大纲将于 2025 年 12 月 31 日实施重大更新,并正式启用,2026年3月考 ...
2025-12-31“字如其人”的传统认知,让不少“手残党”在需要签名的场景中倍感尴尬——商务签约时的签名歪歪扭扭,朋友聚会的签名墙不敢落笔 ...
2025-12-31在多元统计分析的因子分析中,“得分系数”是连接原始观测指标与潜在因子的关键纽带,其核心作用是将多个相关性较高的原始指标, ...
2025-12-31对CDA(Certified Data Analyst)数据分析师而言,高质量的数据是开展后续分析、挖掘业务价值的基础,而数据采集作为数据链路的 ...
2025-12-31在中介效应分析(或路径分析)中,间接效应是衡量“自变量通过中介变量影响因变量”这一间接路径强度与方向的核心指标。不同于直 ...
2025-12-30数据透视表是数据分析中高效汇总、多维度分析数据的核心工具,能快速将杂乱数据转化为结构化的汇总报表。在实际分析场景中,我们 ...
2025-12-30在金融投资、商业运营、用户增长等数据密集型领域,量化策略凭借“数据驱动、逻辑可验证、执行标准化”的优势,成为企业提升决策 ...
2025-12-30CDA(Certified Data Analyst),是在数字经济大背景和人工智能时代趋势下,源自中国,走向世界,面向全行业的专业技能认证,旨 ...
2025-12-29在数据分析领域,周期性是时间序列数据的重要特征之一——它指数据在一定时间间隔内重复出现的规律,广泛存在于经济、金融、气象 ...
2025-12-29数据分析师的核心价值在于将海量数据转化为可落地的商业洞察,而高效的工具则是实现这一价值的关键载体。从数据采集、清洗整理, ...
2025-12-29在金融、零售、互联网等数据密集型行业,量化策略已成为企业提升决策效率、挖掘商业价值的核心工具。CDA(Certified Data Analys ...
2025-12-29CDA中国官网是全国统一的数据分析师认证报名网站,由认证考试委员会与持证人会员、企业会员以及行业知名第三方机构共同合作,致 ...
2025-12-26在数字化转型浪潮下,审计行业正经历从“传统手工审计”向“大数据智能审计”的深刻变革。教育部发布的《大数据与审计专业教学标 ...
2025-12-26统计学作为数学的重要分支,是连接数据与决策的桥梁。随着数据规模的爆炸式增长和复杂问题的涌现,传统统计方法已难以应对高维、 ...
2025-12-26