京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据国家战略还需跨过几道坎_数据分析师培训
大数据时代的到来,让“数据即资产”成为新的全球大趋势,国家竞争焦点正从对资本、土地、人口、资源/能源的争夺转向对大数据的争夺,大数据颠覆性地改变全球战略格局、国际安全态势、国家治理架构和资源配置模式,引发了巨大的经济社会变革。对于中国而言,只有将大数据上升为国家重大发展战略、上升为提升国家治理体系与治理能力现代化的层面才会实现“变道超车”。
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。换言之,如果把大数据比作一种产业,那么这种产业实现盈利的关键,在于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
全球数据正呈现出惊人的增长态势。根据IBM公司估算,人类自有史以来至2003年所创造的信息量为5EB,而到2011年,人类每两天就能产生5EB的信息量。ID C认为,数据产生成本的下降、投资规模的增加和数据存储能力的增长,最终导致了全球数据增速符合“大数据摩尔定律”,即全球数据量大约每两年翻一番。预计到2020年,全球需要管理的数据量将达到35ZB,是2010年的29倍。
从中国情况看,随着信息化普及程度和应用水平的提升,金融、交通、电信等重点行业和医保、社保、海关等重要领域已经实现或逐步实现了大量、海量业务数据的集中。中国拥有全球第一的人口数、互联网用户数和移动互联网用户数,大数据前景广阔,是全球最重要的大数据市场之一,已经成为名副其实的“世界数据中心”。根据工业和信息化部电子科学技术情报研究所的调查,2011年中国电信、金融、医疗、文化等国家重要基础数据总量约为900PB。中国移动互联网流量在过去18个月中增加了10倍,占到全球互联网流量的10%;淘宝网每天交易达数千万笔,其单日数据产生量超过50TB,存储量超过40PB;百度每天大约要处理60亿次搜索请求,数据量达到几十PB,每日新增数据10TB;上海证券交易所每秒处理近9万笔业务,每日成交笔数达到3亿笔以上;中国联通用户上网记录达每秒83万条,即每月1万亿条,对应数据量为每月300TB。
然而,相比领先国家,中国仍面临诸多战略风险与挑战阻碍大数据在国家治理层面上的应用:
一是缺乏比较明晰的大数据战略顶层设计,大数据作为战略性资源地位尚未凸显,作为基础性资产、以及国家/国民财富的重要地位尚未凸显,特别是与之适应的生产关系、制度安排等仍处于空白。
二是条块分割体制壁垒和“信息孤岛”,阻碍国家治理中的数据开放和共享。围墙里的大数据注定成为死数据。目前我国金融信用信息基础数据库已为1859.6万户企业和其他组织及8.2亿自然人建立了信用档案,但这些数据第三方机构很难获得。长期以来,由于条块分割管理体制限制,各级政府部门间的信息网络往往自成体系、相互割裂,数据难以实现互通共享,导致政府掌握的大数据大都处于割裂、闲置和休眠状态。同时,由于政府部门业务管理信息系统开发和建设的“部门化”,政府信息系统出现“系统林立”和分裂状态,公共信息资源重复采集现象严重。
三是传统治理思维和治理体制在大数据时代明显不适应,数据治国的意识较为滞后。世界范围内,大数据正重构政府、市场、社会三者之间关系模式,使国家治理结构实现从国家独大的治理结构转向多元共治,然而,我国不少政府部门尚未意识到利用大数据改造传统政府治理和政府流程再造的革命性影响。
四是法治建设滞后,维护“数据主权”、数据资产的法律标准框架严重缺失,缺乏有效的大数据思维和法律框架。
五是全球大数据战略博弈升级,我国面临较大数据安全与数据防御风险。当前,借助大数据革命,美国等发达国家全球数据监控能力升级,造成我国数据安全和数据防御风险上升。根据“棱镜门”事件披露的信息,美国政府和大数据公司紧密结成“美国数据情报联合体”,共同对全球数据空间进行整体性监控分析,构筑“数据霸权”。美国“八大金刚”几乎渗透到中国政府、海关、邮政、金融、铁路、民航等各个领域,给国家治理带来异常严峻的数据安全隐患。
大数据革命才刚刚开始,这是一场涉及利益深刻调整的革命。笔者建议尽快打破“碎片化”格局,规划“大数据治国”中长期路线图与实施重点、目标、路径,统筹布局,加快大数据发展核心技术研发,推进开放、共享以及安全方面的相关立法与标准制定,建立大数据产业的市场化资源配置模式,以及“互联互通、共享共治”的制度体系,真正抢占新的全球科技革命和产业革命的战略机遇期,重构国家综合竞争优势。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18