
判案预测:大数据PK83位法律专家_数据分析师
法律的生命不在于逻辑,而在于经验?经验与规律哪个更可靠?十余年前一场预测法官判案结果的PK,大数据计算程序出人意料地胜过了83位法律专家,这值得我们关注和思考。天同诉讼圈(微信号:tiantongsusong)今日为您推荐。
2001年,宾夕法尼亚大学法律系教授特德·鲁格(TedRuger)正在参加一个研讨会,听取安德鲁·马丁(Andrew Martin)和凯文·奎因(Kevin Quinn)两位政治学家关于一篇大数据分析文章的报告。马丁和奎因所报告的文章称,仅仅利用与案件政治特征相关的几个变量,他们就能预测出高等法院法官的投票结果。对此,特德不以为然。
特德看起来一点儿也不像大家平时看到的那些貌似身体瘦弱的学究们;他的身材像运动员一样健硕,长着方下巴,脸上虽然布满皱纹但容貌英俊。他听研讨会时,不喜欢那些政治学家们报告其研究结果的方式。“他们实际上用了预测这一术语,”他告诉我,“我坐在那里听,就像一个怀疑论者。”他不喜欢这篇文章,因为他们所做的是预测过去。“跟很多法律或政治科学研究一样,”他说,“这篇文章本质上也是针对过去的。”
因此,在研讨会结束后,他走到他们跟前提出自己的建议。“从某种意义上来说,这一项目的起源就是我事后跟他们说,为什么不做一个前向的检验呢?”他们谈着谈着,就决定进行一场比赛——“友好的跨学科竞赛”,比较一下预测高等法院案例审判结果的两种不同方法。一边是政治学家的大数据分析预测,另一边是83位法律专家的意见。他们的任务是提前预测每位法官对2002年高等法院审过的每个案件的投票结果。专家就是真实的法律资深人士,包括法律系教授、法律从业人员以及法律博学人士(共有38人担任过高等法院法官,33人有教授职称,5人担任或曾担任法律系主任)。大数据分析计算程序要对所有案件的所有法官的投票做出预测,而专家只需预测在他们所专长的领域内的案件投票情况。
令特德没想到的是,比赛结果竟然打成了平手。政治学家的模型考虑了如下六个因素:
(1)案件最初的巡回法庭;
(2)案发地区;
(3)原告类型(如美国、公司雇主,等等);
(4)被告类型;
(5)低等法院规章的意识形态倾向(自由还是保守);
(6)原告是否称某项法律或条例不符合宪法。
特德说:“我原本认为他们的模型包含了决策制定过程中太多没必要的细节,因此法律专家应该预测得更好一些。”对于法律和过去案件的透彻了解毕竟还是管点用的。
这个简单的检验指出了最基本的问题:什么是法律。法官奥利弗·文德尔·霍姆斯(Oliver Wendell Holmes)首创了法律预测说。“法律的生命不在于其逻辑性,而在于经验。”对霍姆斯来说,法律只不过是“对于法官会怎么做的一种预测”而已。霍姆斯不同意哈佛大学主任(也是苏格拉底式法律教育方法的权威)克里斯多夫·哥伦布·兰德尔(Christopher Columbus Langdell)的观点,后者认为“法律是一门科学,这门科学所有能够获得的资料都已经包含在教科书中了。”霍姆斯认为准确的预测与“时间的紧迫性、对于公共政策的直觉、公开或下意识的甚至对于与自己观念相同的法官的偏见”等等密切相关。
政治学中的主流统计模型都是霍姆斯模型,因为该模型几乎完全强调法官的偏见,即主观意识想法。政治学家常常会假设政治理念固定不变,并且服从从自由到保守的平滑分布。根据这种大数据分析计算程序得出的决策树只有细微差别。马丁和奎因使用这9名法官以前审过的628起案件的历史数据,首先考察何时这六大因素预测出的决策结果是一致同意审理或一致驳回上诉。然后,再使用同样的历史数据,针对没有达成一致意见的案件,找出能够最好地预测出每个法官投票的流程图(有条件地结合上述因素)。例如,下面这幅图就是真实研究中用来预测桑德拉·戴·奥康纳(Sandra Day O’Connor)法官的投票流程图。
资料来源:Andrew D. Martin et al,“Competing Approaches to Predicting SupremeCourt Decision Making,”2Perspectives on Politics 763 (2004)
这幅用于预测的流程图相当简单。第一个决策点预测只要低等法院的法案是“自由的”,奥康纳就会驳回上诉。因此,在“格鲁特对伯林杰”案(Grutter VS Bollinger)中,高等法院2002年所审案件挑战着密歇根大学法学院(Michigan Law School)同意审判的合宪决定,该模型仅仅因为低等法庭的审判(在支持法学院同意审判的决定方面)是自由的而错误地预测奥康纳会驳回上诉。如果低等法庭是“保守的”,流程图就会略微复杂一些,决定因素包括最初巡回法庭的预测、被告类型以及案件提交地区。当然,这种统计预测完全忽略了本案件及其之前该法庭所审案件的具体特定问题。而对特定问题了解深入的法律专家自然会做得更好一些。
请注意,使用统计模型时,我们仍然需要人来为案件编码。关键是要有专家来决定低等法庭的决策是“自由的”还是“保守的”。研究表明怎样使统计预测与主观判断相符且相关。统计决策规则不可能不依赖于专家或临床医生的主观判断。规则可以问护士是否认为病人看起来“感觉不舒服”。但这是一种不同寻常的专业知识。不需要依赖专家做出最终决策,专家只需要针对某个症状存在还是不存在给出意见。人类专家也许有一定的发言权,但是大数据分析方程限制了他们自由处置的能力。
特德“进行前向检验”的简单想法为进一步的检验铺平了道路。随着高等法院审判过程的进行,很多知情人都满怀兴趣等着看这项检验。做出最终决策之前,网站上会公布计算机和专家分别做出的预测,这样每个陪审员的观点提交上去时,人们就都可以直接看到结果了。
最后专家输了。对于2002年审判的所有案件,模型预测的法庭同意审判或驳回上诉的结果正确率为75%,而所有法律专家一起只预测对了59.1%。在预测奥康纳法官和肯尼迪的关键选票上,大数据分析尤为有效。对于奥康纳的选票,模型预测正确率为70%,而专家的正确率仅为60%。
极为简化的统计模型的预测能力不仅胜过律师,而且胜过拥有案件详细信息的该领域专家,这怎么可能呢?这一结果只是统计上的反常现象吗?它与法律界的特质或自大有没有关系?简单地回答,特德的检验代表了更加一般意义上的现象。几十年来,社会学家一直在比较大数据天才与传统专家的预测谁更准确。一个又一个的研究表明,大数据天才有占上风的趋势。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15