京公网安备 11010802034615号
经营许可证编号:京B2-20210330
检察院里的“大数据思维”_数据分析师
信息化、大数据是眼下的热词。讲究程序正义、所办案件千差万别的检察机关该如何实现信息化的转型?
北京市人民检察院独辟蹊径,全面整合了历年来的办案数据,通过数据挖掘技术,为执法办案提供辅助决策,形成了全面、全程、全要素覆盖的“检立方”。
最近,北京市朝阳区人民检察院检察长王向明养成一个新习惯,一上班就要打开“检立方”系统,看看本院立案、办结、办案时限等各项数据,“知道了这些数据,心里就有了底,哪些该盯一盯、哪些要重点关注,哪些要特别留意的,心里就有了一本账。”朝阳检察院一年要办理3000余件公诉案件,依靠人工汇总信息难免有疏漏,而“检立方”把所有关键数据都做了图像化处理,一目了然。
“信息化对于检察机关而言,不是把原来手写的文书用电脑打出来、把原来办案的请示报告搬到网上,而是运用数据挖掘和信息化工具提供解决方案。”北京市人民检察院副检察长高祥阳说,运用大数据为检察机关全业务流程服务,促进检察机关依法规范行使检察权,是“检立方”的最终目标。
把50万件案件数据打造成为“检察大数据”
打造“检立方”的思路最早竟然源自“舍不得”。
2013年底,全国检察机关根据最高人民检察院统一部署,推进使用统一业务应用系统,以前各省自行开发的业务系统由于标准不统一、数据不兼容等原因不再使用。
消息一传出,北京市检察院就犯了难。“北京市检察机关从2004年开始就开发、应用自己的执法办案业务应用系统,推进检察业务和检察管理信息化已走过10年历程。这期间,我们积累了超过9800万项的业务数据,建成了一个庞大的数据仓库,这是一笔宝贵资源。” 高祥阳说,“因此,北京市检察院决定着手开发一套辅助系统,对检察数据资源进行深度挖掘、整合与利用,最大限度发挥这些数据的价值。这就是开发‘检立方’的初衷。”
“大数据”和“检察业务”是“检立方”的两大支柱,但以何种模式把两者有机结合在一起,却让具体负责“检立方”开发的北京市检察院检察技术处处长孙玲玲头疼了许久。经过几十次的调研、论证,北京市检察院最终形成了“检立方”的核心理念,即:一核、三轴、多面的大数据立方体。“一核是指以检察数据为核心,三轴是指以规范、监督、公开为三条主轴。在这些维度上,同时开发统计分析、预警研判、管理支撑等多项基本功能,形成检察业务的多维度管理体系。”孙玲玲说,目前,“检立方”已经采集案件信息50余万件,业务数据9800万项,生成692项业务统计指标,将最高检确定的26项核心数据以及北京市检察机关53项辅助数据悉数涵盖其中,这些数据均细化到每一个院、每一个部门、每一名检察办案人员。
实现执法司法质量实时动态监控监督
“对于个人而言,‘检立方’更像是办案实时监测系统,每天提醒你手头还有多少案件没有办结、哪些案件用的时间比较长、哪些环节存在问题隐患等。”朝阳区检察院公诉处检察官张亚男说。
不仅对自己的办案情况一目了然,张亚男还能看到本院甚至全市公诉部门检察人员的办案数据,“有了这个业务参照系,就能清楚自己的办案业绩在全市处于一个什么样的位置,有助于及时发现差距,改善工作方式。”张亚男说,截至今年10月,她的案件办结率已90%以上,超出同期全市平均水平近8个百分点。
“检立方”的设计理念之一就是要通过这种“互相看得见”的模式,实现网上办案、网上管理、网上监督、网上考核,从绩效、案件、时间、人员四个维度,把案件数据细化到每个检察院、每个部门和每名检察人员,为准确评价执法办案和公开透明奠定基础。
区别于传统的信息化系统,除了统计分析功能外,“检立方”最大的亮点还在于实现了执法司法质量的实时动态监控。在“检立方”里,每一起案件的所有信息都集纳在一张表上,审查批捕的是谁、审查起诉的是谁、出庭公诉的是谁清清楚楚,部门之间能实时看到案件办理情况,打破部门之间的信息界限也就实现了检察院各环节之间的监督。可以说,“检立方”打破了案件信息之间的壁垒,不仅整合了部门之间的办案信息,而且实现了市院、分院、基层院三级检察院案件信息的贯通。
此外,“检立方”还接入了全市检察机关控申接待室、大要案指挥中心、提讯室等执法场所的视频信号,实现了对执法司法场景监督全覆盖。“我们按照最高检的要求,做到凡接触犯罪嫌疑人必录、凡问必录、凡搜查必录,在移送逮捕、起诉时,这些同步录音录像资料可根据诉讼需要一并接受审查。”高祥阳说,这些措施有效保障了犯罪嫌疑人的合法权利,有效杜绝了非法取证行为。
“玻璃房子”实现执法办案全程公开透明
“信息化技术使得北京市检察机关在内部实现了透明化办案,所有的办案流程、所有的环节节点都在‘检立方’系统内一目了然。这就好比一间玻璃房子,实现了公开与透明,而检察官必须适应这种公开透明条件下的执法办案新模式。”高祥阳表示。
然而,即使在拆掉了内部的“水泥墙”之后,检察院对于社会公众而言,仍然还存在信息障碍,如何加强检务公开,实行阳光检务,是“检立方”的努力方向。
据北京市大成律师事务所律师苗谦介绍说,“检立方”系统专门设置了律师接待平台,大大方便了律师。“以往承办一个案件,约见检察官、了解检察机关对案件的办理进度,是律师最为头疼的事情,因为时间、进度自己都不好掌握。现在有了‘检立方’系统,不光是约见检察官不需要打电话,还可查询自己承办的案件在检察院的办理进度和详细信息。”
作为一位执业将近20年的律师,苗谦还有一个身份是北京市人大代表,多年来,他一直致力于推动司法机关工作的公开、透明,北京市人民检察院的“检立方”数据平台的推出,让他感到很振奋,“检察机关往往给人以神秘感。现在,通过‘检立方’系统,使得所有的办案信息能够在网上查询,流程也很规范,一方面满足了群众对知情权的渴望;另一方面,也使检察工作得到规范,有利于依法独立公正行使检察权。”
事实上,“检立方”大数据信息平台只是北京市人民检察院为了依法独立公正行使检察权、严格规范执法、深化检务公开、提高司法公信力而推出的一个信息化支撑。在日常的工作中,树立严格规范执法的意识,完善严格规范执法管理监督机制、深化检务公开,一直是北京市人民检察院的改革重点。北京市人民检察院党组书记、检察长池强表示:“‘检立方’大数据平台,就是要通过信息化手段推动和保障严格规范公正文明执法,深化检务公开,完善案件流程信息、法律文书统一上网和公开查询制度,建立网上、网下‘一站式’服务,‘一个窗口’对外的便民接待和服务模式,及时回应社会关切,自觉接受人民群众监督。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据科学的工具箱中,析因分析(Factor Analysis, FA)、聚类分析(Clustering Analysis)与主成分分析(Principal Component ...
2025-12-18自2017年《Attention Is All You Need》一文问世以来,Transformer模型凭借自注意力机制的强大建模能力,在NLP、CV、语音等领域 ...
2025-12-18在CDA(Certified Data Analyst)数据分析师的时间序列分析工作中,常面临这样的困惑:某电商平台月度销售额增长20%,但增长是来 ...
2025-12-18在机器学习实践中,“超小数据集”(通常指样本量从几十到几百,远小于模型参数规模)是绕不开的场景——医疗领域的罕见病数据、 ...
2025-12-17数据仓库作为企业决策分析的“数据中枢”,其价值完全依赖于数据质量——若输入的是缺失、重复、不一致的“脏数据”,后续的建模 ...
2025-12-17在CDA(Certified Data Analyst)数据分析师的日常工作中,“随时间变化的数据”无处不在——零售企业的每日销售额、互联网平台 ...
2025-12-17在休闲游戏的运营体系中,次日留存率是当之无愧的“生死线”——它不仅是衡量产品核心吸引力的首个关键指标,更直接决定了后续LT ...
2025-12-16在数字化转型浪潮中,“以用户为中心”已成为企业的核心经营理念,而用户画像则是企业洞察用户、精准决策的“核心工具”。然而, ...
2025-12-16在零售行业从“流量争夺”转向“价值深耕”的演进中,塔吉特百货(Target)以两场标志性实践树立了行业标杆——2000年后的孕妇精 ...
2025-12-15在统计学领域,二项分布与卡方检验是两个高频出现的概念,二者都常用于处理离散数据,因此常被初学者混淆。但本质上,二项分布是 ...
2025-12-15在CDA(Certified Data Analyst)数据分析师的工作链路中,“标签加工”是连接原始数据与业务应用的关键环节。企业积累的用户行 ...
2025-12-15在Python开发中,HTTP请求是与外部服务交互的核心场景——调用第三方API、对接微服务、爬取数据等都离不开它。虽然requests库已 ...
2025-12-12在数据驱动决策中,“数据波动大不大”是高频问题——零售店长关心日销售额是否稳定,工厂管理者关注产品尺寸偏差是否可控,基金 ...
2025-12-12在CDA(Certified Data Analyst)数据分析师的能力矩阵中,数据查询语言(SQL)是贯穿工作全流程的“核心工具”。无论是从数据库 ...
2025-12-12很多小伙伴都在问CDA考试的问题,以下是结合 2025 年最新政策与行业动态更新的 CDA 数据分析师认证考试 Q&A,覆盖考试内容、报考 ...
2025-12-11在Excel数据可视化中,柱形图因直观展示数据差异的优势被广泛使用,而背景色设置绝非简单的“换颜色”——合理的背景色能突出核 ...
2025-12-11在科研实验、商业分析或医学研究中,我们常需要判断“两组数据的差异是真实存在,还是偶然波动”——比如“新降压药的效果是否优 ...
2025-12-11在CDA(Certified Data Analyst)数据分析师的工作体系中,数据库就像“数据仓库的核心骨架”——所有业务数据的存储、组织与提 ...
2025-12-11在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05