京公网安备 11010802034615号
经营许可证编号:京B2-20210330
千万不要被大数据洗脑和挟持
钱钟书先生写过一篇妙文,说从整个历史来看,古代其实相当于人类的小孩子时期,先前是幼稚的,经过了千百年的长进,慢慢才到了现代。时代越是古旧,它的历史就越短,时代越是在后,它积累的阅历越是深厚,年龄就越多。所以,总结来说,我们反而是我们祖父的前辈,上古三代反不如现代悠久古老。
现代人完全可以这样对待我们的历史和传统。我们的时代正在用这样的一种方式瓦解经典,时间再也不是淘洗作品的永恒标准,因为传统无法解释现代人的经验,历史也无法应对高速变化的现实,共识已经瓦解成了个人主义的炮灰,经典备受质疑,经典之中也许并无圣人之言,很可能都是无用的废话——如果按照现如今大数据的标准,所有的经典都应该抛弃在垃圾堆,因为其中撰写的都是无用之言和可疑之言,缺乏合理的大数据的论证。
这话说得有些滑稽,但确实是切中要害的现实概括:大数据神话正在横扫一切领域。原本我们以为大数据只能在科学等实证领域兴风作浪,后来才发现,大数据神话的野心是掌控一切现实,就连人文学科,也同样需要大数据的支撑,没有大数据支撑的文章都是耍流氓。以前,我们写文章会习惯性地写,苏格拉底说过,未经省察的人生是不值得过的。现在写作就会说,根据统计数据显示,或者根据某份权威的调查报告的统计数字,未经省察的人生幸福指数只有20%-40%左右。我们时代最流行的阅读是别人替你读书,把书的内容划重点,归纳和总结出各种所谓的“干货”和教条,然后塞给你,你马上就觉得自己变成了博学多知的百科全书——这就是现在“逻辑思维”正在推广的学习方式。我们渴望的知识不再是经过时间的淘洗依然存在的经典,我们最想获得的知识是维基百科。
按照现在最时髦的理论——其实就是流行的《未来简史》《大数据时代》之类通俗读物——人类所有的知识都可以归纳为某种算法。比如在中世纪,获得知识的公式是:知识=经文 逻辑。简单说就是,如果你先想要知道某个问题的答案,中世纪的人会阅读相关经文,然后用中世纪逻辑来理解经文的确切含义。
而进入了科学革命时代之后,这个算法的公式就是:知识=实证数据 数学。以地球的形状为例,我们就要搜集相关的实证数据,观察太阳、月亮和行星,积累了足够的观测值,再用数学工具加以分析,利用三角学进行推断。
很显然,以上的两个公式就算是正确的,帮助我们解决了很多问题,但仍然具有很大的缺陷,它无法处理我们的人生价值和意义问题。所以,某些以创造公式为己任的人,又费尽脑汁创造了一个获得伦理知识的公式:知识=体验 敏感性。就是说,如果我们想知道任何道德问题的答案,我们需要连接到自己的内心体验,并以最大的敏感性来观察它。
但是这个就很模糊了,体验不能用数据测量,敏感性更是无迹可循,唯一依靠的只有自己的感觉。如何对自己的感觉进行量化,或者用流行的大数据进行统计呢?如果这些都属模糊的数据,这种知识如何获得?所以在伦理学领域,或者在我们寻找人生意义的问题上,无法用一个统一的公式获得共识——幸好如此,否则我们都利用这种算法计算我们的感受,那人生还有什么意外的乐趣?
我不知道大数据时代到来对生活影响有多大。我只知道,任何数据都无法解决我人生各个阶段的意义,更无法解决抑郁、自杀、快乐、苦闷等情绪上的问题。换句话说,千万不要被大数据洗脑和挟持,我们不是大数据的人质,大数据应该是我们解决某种问题的方式。好像在每一个时代都会有这样一个走火入魔的时期,我们有上帝和神学统治一切的时期,然后是启蒙理性统治的时代,现在是大数据时代。但它们都不能成为简化人生的公式和算法。就算人工智能可以使用各种算法赢得未来,就算机器战胜了人的大脑,它只能说明人类的大脑比机器聪明,而不是相反,更不会让我们对其顶礼膜拜。对我们而言,无论是人工智能,还是大数据,它们只能成为人类寻找生命意义的工具,而不是目的。它们代替不了人类的未来。
试读
那些被认为内向的人经常会提到,比起面对多个人,他们在一对一的交谈中感觉更自在。别人也认为他们是很棒的聆听者,因为他们更注重谈话深度,而不是广度。通常情况下关键就在于开启对话的方式。你可以从一个小话题开始,询问别人的名字,或者问问他们是否有小孩或者宠物,用一些活跃气氛的话语开始交谈。一旦你找到对方深有所感的兴趣点或者关注点,谈话就会自然而然地展开。
——珍妮弗·康维勒
《内向者沟通圣经》
说到底,自己现在几岁了?连这都不清不楚。不,即使计算,也可想而知。自己度过的每一天,跟牛皮纸一样薄,没有厚度。那种东西,管他叠上多少张,都厚不到哪儿去吧。一分和一秒差不多了。一回神,往往一两个小时已经过去。那么十年、百年应该也差不到哪儿去。既然如此,算了也白算。——[日]京极夏彦
《百鬼夜行 阳》
散步这件事——我认为是人类的日常中最自然的行为,同时,也有很重要的意义。此外,散步这一行为是否具有目的性,也是值得考虑的一点。
散步是件非常自由的事。没有目的地的条件限制,也没有时间的束缚。而且,走路的步调及速度都是自由的,还讲究心情闲适。散步时,偶尔的立足停顿也是必需的。
——[日] 谷口治郎
《散步去》
中国人讲“情”,跟“爱”又不一样,“情”好像是宇宙的一种原动力,一切的发生就靠这个“情”字,它比那个“爱”字深广幽微。曹雪芹是用一个宇宙性、神话性的东西来说这个“情”字,“情”字还不够,还有“情根”,情一生根,麻烦了!《牡丹亭》里面有句话:“情根一点是无生债。”情一生根以后这个债就还不完了。
——白先勇
《白先勇细说红楼梦》
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如 ...
2025-11-20在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从 ...
2025-11-20在商业数据分析领域,“懂理论、会工具”只是入门门槛,真正的核心竞争力在于“实践落地能力”——很多分析师能写出规范的SQL、 ...
2025-11-20在数据可视化领域,树状图(Tree Diagram)是呈现层级结构数据的核心工具——无论是电商商品分类、企业组织架构,还是数据挖掘中 ...
2025-11-17核心结论:“分析前一天浏览与第二天下单的概率提升”属于数据挖掘中的关联规则挖掘(含序列模式挖掘) 技术——它聚焦“时间序 ...
2025-11-17在数据驱动成为企业核心竞争力的今天,很多企业陷入“数据多但用不好”的困境:营销部门要做用户转化分析却拿不到精准数据,运营 ...
2025-11-17在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10