京公网安备 11010802034615号
经营许可证编号:京B2-20210330
充分挖掘司法大数据的超凡价值
司法大数据不仅可以成为法官公正司法的“校准器”,还可以成为观察经济发展的“晴雨表”,成为推动社会治理的“方向标”,成为人民群众规范行为的“指南针”。
说到司法大数据,我们首先想到的是全国法院一年受理案件的总数。以2016年为例,全国法院受理案件接近2000万件。其中,最高人民法院受理案件15985件,审结14135件;地方各级人民法院受理案件1951.1万件,审结、执结1671.4万件,结案标的额4万亿元。需要特别说明的是,按照公认的大数据定义,这些数据还不能称为司法大数据,仅仅是一些重要和宏观的司法数据。因为,它们还没有经过加工分析,没有经过结构化改造,所能够提供给我们的信息还十分有限,数据背后的信息还没有被充分地挖掘出来,因此也就无法被有效地使用。
的确,大数据不仅仅表现为数据的规模之大,更代表着数据处理所需的以人工智能为代表的新技术和新方法,代表着从海量的数据中找到过去不容易昭示的经验、规律和预测,代表着大数据分析和应用所带来的新创造、新服务和新机遇。没有分析加工提炼的数据,无论其数量有多么庞大、构成多么复杂,都不能称之为大数据。只有通过对数据的大量输入并加上复杂运算,让数据不断产生又不断拆分、整合,融合生成新的产品,然后输出、使用,才能形成“数据生产信息,信息改善决策”。这正是大数据发挥作用的基本原理。也就是说,大数据之所以能够带来神机妙算般的超凡价值,关键在于对数据的分析、挖掘、加工、提炼,能够从海量的数据中分析和提取出有规律的信息,能够对未来趋势进行预测的信息,进而影响和改善我们的决策。司法数据相当于生产资料,互联网相当于基础设施,云计算相当于生产工具,三者共同组成了信息时代的司法大数据。
如何适应互联网信息技术发展带来的机遇,充分挖掘司法大数据可能具有的超凡价值,是加强司法大数据研究与应用的重大课题,也是周强院长交给各级人民法院的一项重要工作任务。党的十八以来,在周强院长大力倡导和推动下,人民法院的信息化建设取得飞速进展。经过短短几年努力,从立案、审判到执行的全流程,最高人民法院已经搭建起了大数据管理和服务平台,实现了全国法院网络和信息基础设施全覆盖,全国3519个法院和9279个人民法庭通过专网实现互联互通。现在,各级法院正以每5分钟一次的频率向大数据管理和服务平台自动汇聚新收集的各类案件数据。目前,平台已经汇集了1亿多件案件数据和2900多万份裁判文书。面对呈指数增长的司法数据,初步实现了数据的“收集、保存、管理”。下一步,要在数据的“复杂运算”方面下大功夫,实现数据的“分析和共享”。
我们注意到,一些地方对司法大数据的研究与应用已经取得了不少可喜的成绩。比如,通过网络审判辅助系统分析案件的全部电子卷宗材料,自动为办案法官推送直接相关的法律法规、指导性或参考性案例等各类型法律文献,为法官提供智力支持;通过信息化实现资源共享,为不同法院审理同类案件提供大致统一的裁判尺度,避免同案不同判和法律适用不统一的问题;通过现代信息技术手段,缩减办案和执行期限,提高整体办案效率;通过网络流程再造,实现对办案工作的自动预警和智能监督。但总体上看,对大数据的收集、研究与应用还处在一个比较粗浅的层面上,司法大数据可能具有的超凡价值远远没有得到挖掘。
大数据的世界是现实的,也是超现实的;是过去的,更是面向未来的。通过数据的不断交换与交流,通过数据以及数据的不断使用,通过人工智能的复杂运算,带来的是更多源源不断并及时更新的新数据,展示出的是一个更清晰、更量化的经验世界,可以为人们的决策提供更值得借鉴的参照。未来,通过不断升级的人工智能和智慧法院建设,人们甚至可以顺利实现对诉讼结果的预测。这正是周强院长推动成立司法大数据专门研究与开发机构的要义。因为,司法大数据不仅可以成为法官公正司法的“校准器”,还可以成为观察经济发展的“晴雨表”,成为推动社会治理的“方向标”,成为人民群众规范行为的“指南针”。为此,周强院长要求以建设智慧法院为目标,充分利用人民法院丰富的案例资源,加强数据化分析等系统的开发和运用,更好地服务审判执行,服务人民群众多元司法需求,服务经济社会发展。
随着大数据日益转化成为国家基础性战略资源,拥有司法数据的规模以及分析解释运用这些数据的能力,也必将成为人民法院综合能力的重要组成部分。我们期待能够建立起司法大数据的全套指数系统,不仅为法院系统服务、为法官公正司法服务,还可以用司法大数据为国家治理现代化提供基础数据和决策支撑,为党和政府服务、为社会服务、为人民群众服务。当然,这需要互联网有关产业机构、数据机构的共同参与,也期待有更多的政府部门和律师机构,积极支持和参与到建设司法大数据发展指数系统中来,打造共享的数据交换交流平台,实现利国利民利己的大壮举。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27