京公网安备 11010802034615号
经营许可证编号:京B2-20210330
为何要从数据管理,进化到大数据治理_数据分析师
最近参加了“中国优秀首席信息官(CIO)评选”的颁奖大会,现场很多人都在谈大数据,其中有传统行业、有银行、也有医院。我注意到大部分演讲嘉宾均集中讨论如何应用大数据,或是如何用数据进行创新。
但跟以往的很多会议一样,我很少听到数据作为原材料应该怎么管理。
你可能会说,银行业、通讯业等不是早就在做数据管理了吗?
的确,数据管理(data management)并非新鲜,20年前就有人在做了。但在数据呈指数级增长之下,我们现在讲的数据已跟以往不一样。不仅是数据的大小,而且包括数据的内容、来源、结构等都很不一样。
以往我们可能根本不敢想象,Facebook的日均新增数据量已达到600T。与此同时,无数以往不可能出现的算法和应用也随之呈爆炸式增长。
数据在创新;算法在创新;应用也在创新。我们不禁会问,以往的数据管理思路,能适应新形势的要求吗?
自上而下管理费时失事
在一些传统银行,若你需要看某个数据,就必须拿着申请单找一堆人签字,最后,从一个类似医院取药的视窗中,将按照流程签满字的纸递给数据管理员。
而这个管理员会告诉你,你要等几个小时才可拿到数据。
因他要从一大堆备份中,找出你要的数据,加载完后才能给你。这就是传统的数据管理方式:严格按照自上而下的流程进行,甚至要做到滴水不漏。
后来,这个银行发生了一个对他们来说具有时代意义的改变——那个帮你找数据的管理员,变成了机器人。虽然机器人的效率大大提升了,但数据管理的本质却没有变化。
在大数据时代,数据将会促成新技术的发展,以及更多新数据的产生。
开放的网络环境、频繁的数据更新、丰富的数据种类,加上数据保护的需求激增、数据生态圈的物种增多、流动性加快……这些复杂多变又未知的环境,对于中央式管理是极大的挑战。
试想,若还是按照以往的方式,会出现怎样的情形?
也许,数据的审批人会比数据的使用者还多;也许,数据的创新会停滞不前;也许,数据的应用价值会比现在晚几年才被发现……
数据治理须人人参与
因此,我们必须意识到,数据治理不等同于数据管理,绝非依靠自上而下的贯彻执行便可解决。
相反,数据治理需要每个人的参与和协同,要求每个人都有意识去治理好数据。而且数据治理本身也可以变成应用和创新,成为更多应用和创新的“水、电、煤”。
在数据产生价值之前,不管看数据还是直接应用数据,首先都要注意:数据有没有?数据准不准?粒度细不细?是否稳定的?
若行政总裁每天看的数据都是错误的,或者不是稳定产出的,那么企业依赖数据的决策将付出极高代价。
所以企业若不做数据治理,或者还是按照以往的思维来管理数据,那么,日后对数据的依赖愈深,便可能愈快出问题。
数据治理的新思路,不仅是指组织结构上要从由上而下变成全体协同,而且要在技术上创新,提供更智能的治理工具,帮助大家提高数据质量、保护数据安全及有效控制数据成本。
最后我想说,大数据时代的数据治理,一定是将有形的管理策略化成无形的智能产品,从一纸命令变成根植在每个人脑中的信念和下意识的习惯。我们要用大数据的思维方式,用数据来治理数据。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、机器学习的实操场景中,聚类分析与主成分分析(PCA)是两种高频使用的统计与数据处理方法。二者常被用于数据预处理 ...
2026-02-24在聚类分析的实操场景中,K-Means算法因其简单高效、易落地的特点,成为处理无监督分类问题的首选工具——无论是用户画像分层、 ...
2026-02-24数字化浪潮下,数据已成为企业核心竞争力,“用数据说话、用数据决策”成为企业发展的核心逻辑。CDA(Certified Data Analyst) ...
2026-02-24CDA一级知识点汇总手册 第五章 业务数据的特征、处理与透视分析考点52:业务数据分析基础考点53:输入和资源需求考点54:业务数 ...
2026-02-23CDA一级知识点汇总手册 第四章 战略与业务数据分析考点43:战略数据分析基础考点44:表格结构数据的使用考点45:输入数据和资源 ...
2026-02-22CDA一级知识点汇总手册 第三章 商业数据分析框架考点27:商业数据分析体系的核心逻辑——BSC五视角框架考点28:战略视角考点29: ...
2026-02-20CDA一级知识点汇总手册 第二章 数据分析方法考点7:基础范式的核心逻辑(本体论与流程化)考点8:分类分析(本体论核心应用)考 ...
2026-02-18第一章:数据分析思维考点1:UVCA时代的特点考点2:数据分析背后的逻辑思维方法论考点3:流程化企业的数据分析需求考点4:企业数 ...
2026-02-16在数据分析、业务决策、科学研究等领域,统计模型是连接原始数据与业务价值的核心工具——它通过对数据的规律提炼、变量关联分析 ...
2026-02-14在SQL查询实操中,SELECT * 与 SELECT 字段1, 字段2,...(指定个别字段)是最常用的两种查询方式。很多开发者在日常开发中,为了 ...
2026-02-14对CDA(Certified Data Analyst)数据分析师而言,数据分析的核心不是孤立解读单个指标数值,而是构建一套科学、完整、贴合业务 ...
2026-02-14在Power BI实操中,函数是实现数据清洗、建模计算、可视化呈现的核心工具——无论是简单的数据筛选、异常值处理,还是复杂的度量 ...
2026-02-13在互联网运营、产品迭代、用户增长等工作中,“留存率”是衡量产品核心价值、用户粘性的核心指标——而次日留存率,作为留存率体 ...
2026-02-13对CDA(Certified Data Analyst)数据分析师而言,指标是贯穿工作全流程的核心载体,更是连接原始数据与业务洞察的关键桥梁。CDA ...
2026-02-13在机器学习建模实操中,“特征选择”是提升模型性能、简化模型复杂度、解读数据逻辑的核心步骤——而随机森林(Random Forest) ...
2026-02-12在MySQL数据查询实操中,按日期分组统计是高频需求——比如统计每日用户登录量、每日订单量、每日销售额,需要按日期分组展示, ...
2026-02-12对CDA(Certified Data Analyst)数据分析师而言,描述性统计是贯穿实操全流程的核心基础,更是从“原始数据”到“初步洞察”的 ...
2026-02-12备考CDA的小伙伴,专属宠粉福利来啦! 不用拼运气抽奖,不用复杂操作,只要转发CDA真题海报到朋友圈集赞,就能免费抱走实用好礼 ...
2026-02-11在数据科学、机器学习实操中,Anaconda是必备工具——它集成了Python解释器、conda包管理器,能快速搭建独立的虚拟环境,便捷安 ...
2026-02-11在Tableau数据可视化实操中,多表连接是高频操作——无论是将“产品表”与“销量表”连接分析产品销量,还是将“用户表”与“消 ...
2026-02-11