
大数据如何再造历史研究
历史学家该如何向公众讲述真理,该怎样说服政府,该以什么样的方式防止以扭曲、片面、狭窄的视角解读历史?
相比经济学,历史学在公众议程、公共政策领域获得的重视要低得多。但反过来,包括经济学在内,各热门学科往往也会以自己的方式切入历史、使用历史,来证明特定的论点。例如经济学家西蒙·库兹涅茨就根据大萧条至20世纪60年代的美国经济数据,分析指出经济的持续发展将使得不平等现象自然消除。生态学家加勒特·哈丁发明出“公地悲剧”的概念,认为地球因面临人口超载,将成为过度放牧的荒野牧场,最终导致巨大的生态和道德悲剧。而近年来,一些经济学家、环境学家强调必须遏制中国、印度等新兴市场国家对于能源的粗放利用,理由是最近二三十年来新兴市场国家更加突出地暴露出严重污染、浪费式消耗能源等问题。
用经过裁剪的历史事实、数据来论证特定论点,这不叫做对于历史的尊重。美国历史学家、布朗大学历史学助理教授乔·古尔迪与英国历史学家、哈佛大学历史学教授大卫·阿米蒂奇合著的《历史学宣言》,对于当下一些学科、公共政策领域采用裁剪历史、短时历史(用区区十几年至几十年的历史)的方式提出强烈质疑,强调应该对应采用长时段历史、更加完整的历史来防止轻率和武断。
作者指出,当环境史学家加入生态、环境问题研究,借助长时段的土地和水资源使用史料数据,可以非常精确地反映历史上各大洲何时何地曾出现恶劣的生态环境,是何原因,又是如何克服的……研究发现,人类社会并非第一次遭遇环境恶化,并因此催生出新的治理形式。而不同大洲许多地方历史上也积累了应对生态和环境问题的有效经验,相比经济学界开出的简单化的方案,对于应对和解决问题具有更强的适用性。同样,要求新兴市场国家为当前世界污染和能源问题承担主要责任,也并不符合长时段的历史事实。
近年来,随着大数据等技术手段投入到历史学研究,更多的历史数据还有助于破除经济学等学科长期以来形成的理论迷信。书中指出,既有的自由市场观念通常强调政府监管、对于利益集团征税会妨碍经济增长。但较长时段所累积的历史数据,给出的判断恰恰相反。
两位作者希望历史学家能够更好地切入公共政策和公共议程,扭转近一个世纪以来包括部分历史学者、其他学科专家采用裁剪历史、短时历史来误导决策者和公众的局面,更为充分地发挥长时段历史研究与阐释的优势。
《历史学宣言》回顾了近现代历史上,历史学界长期形成的长时段历史叙事方式,指出这种导向源自古希腊-古罗马以及其他古代文明的史学传统,带有强烈的关注未来、道德训诫意味,有助于增加现实政策的前瞻性。而20世纪后半期,以霍布斯鲍姆为代表的历史学家,撰写了大量长时段的历史作品,鼓励尊重多元文化、平民生存权利,并强调要警惕还原主义的叙事。长时段历史叙事有助于避免各领域的专家、官员及公众陷入对于某种政策的玫瑰化预期。比如人们通过历史叙事更加明晰工业革命带来的不仅有进步,还有“被侮辱和被损害”的几代劳工,了解到技术和资本对于人的戕害十分显著,使得人们更加注重社会的均衡发展,注重公共福利建设,而不是仅仅满足于技术带来的增长成果。
书中指出,20世纪后半期,随着经济学、社会学等学科在公共政策和公共议程中开始发挥前所未有的影响,史学研究开始“习惯在短期历史的框架下寻找素材”,甚至主动从历史角度寻找素材来解读现实政策(的合理性)。而另一些历史学家热衷研究“微历史”,即细小事件、小人物的历史,不仅以此证明专家“谙熟史料”,而且还能写得很有趣味性,讨好大众读者和市场——这些历史学家对于历史的宏大叙述既无兴趣,而且还竭力否认其价值所在。
21世纪复兴历史学、复兴长时段历史研究和叙事的有利条件在于——大数据的投入使用。“传统的(历史)研究受制于未经数字化处理的文献数量极大,根本没有足够的时间全面梳理”,最后只能变成概要化甚至错误化的研究。而今,“有了便利的工具,并能够借此对大量的量化信息进行比对”,长时段历史叙事的前景空前开阔。无论是全球通史、国家通史,还是专门的气候史、贸易史、农业生产史、食物消费史等,历史学家也好,其他领域的专家,以及公众也好,都会受益于海量数据被重新投入历史研究,更加清晰地揭示更为精确的历史规律。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01