京公网安备 11010802034615号
经营许可证编号:京B2-20210330
政府开放大数据,规则界定前大公司优先
大数据终于不再是纸上谈兵,而是进入到实际应用阶段,标志性事件是两会上,李克强总理明确表态,政府应该尽量的公开非涉密的数据,以便利用这些数据更好的服务社会,也为政府决策和监管服务。这是中国政府首次正式公开表态支持大数据。
在此之前中国各级政府一些部门已在大数据开放上有所尝试,从实际情况来看,还存在开放规则不明朗的问题,不过一个大方向确实:大公司优先。
政府部门大数据成为企业眼里的“香饽饽”
大数据是金矿,企业和政府都已经意识到其中的价值,在大数据上有野心的企业都期望获得更多有价值的数据,可能是来自其用户,可能是来自合作伙伴,还有一个重要来源是政府等组织机构的公开数据。 不同来源不同性质的数据关联在一起交叉挖掘分析,会发生“化学反应”得到更多价值。阿里巴巴拿到微博数据可以挖掘做好精准营销、拿到交通部门数据可以与菜鸟网络结合、拿到金融监管部门数据便可与用户交易和理财记录结合做个人征信;百度拿到交通部门数据可以与百度地图结合、拿到博彩指数公司数据结合网络数据做世界杯预测……
2015年开始中国政府对互联网、高科技和大数据产业的空前重视,并且明确表态要开放大数据,因此势必会有更多的政府数据开放给民间。这些大数据成为相关企业眼里的“香饽饽”。这些数据如何开放、开放给谁、如何使用,却还不明朗。
政府大数据使用权尚不明朗,需边走边看
阿里、百度这两家中国最积极的大数据玩家,过去便与一些政府部门接入了大数据。
2013年2月25日,国家食品药品监督管理局与百度在北京联合举行“安全用药,搜索护航”战略合作签约仪式。国家药监局的三大药品数据库,总计20余万个权威药品信息全面入驻百度。
2014年5月27日,中国气象局公共气象服务中心与阿里云达成战略合作,共同搭建“中国气象专业服务云”,面向有气象数据需求的企业提供专业化的云计算服务。
2014年7月23日,百度推出名为“北京健康云”的智能医疗平台产品,这是北京市政府支持推动下的一个民生医疗项目。
2014年10月15日,“云上贵州”系统平台正式开通运行,这是贵州省政府与阿里牵头的企业合建的云计算基础设施,应用在交通等领域。
2015年1月13日,阿里健康宣布将药品监管网的基础设施从甲骨文数据库迁移到阿里云平台,阿里将利用大数据技术帮助解决假药问题。
政府在大数据上已经动了起来,百度和阿里成为第一批吃螃蟹者。问题是,这些数据不只是它们想要,阿里和百度之间有竞争关系不说,还有不少相关企业都有拿到这些数据的诉求。 比如药监局的药品数据库,百度和阿里先后拿到之后,便有医学药学生命科学专业网站“丁香园”站出来表示,这些数据应该以公平的方式开放给更多企业,以达到数据安全,市场公平和效率最高的目的。显然在纷纷认识到大数据的重要性之后,围绕大数据的争抢已经展开。
美国政府在大数据开放上有着先进的经验,《大数据》这一大数据启蒙教材的主要案例便是围绕美国政府大数据的开放案例,这本书曾被副总理汪洋公开推荐给官员。“用纳税人的钱收集的数据应该免费提供给纳税人使用”书中提及的一个观点。
不过,道理简单,操作却并不可一蹴而就:哪些数据是可以开放的(李克强总理提到非涉密数据,不知道是否已有明确界定规则)?开放的程度是怎样的?开放的方式如何:是面向特定企业开放还是建设系统纳入统一数据开放平台之中?是有偿开放给企业还是免费开放给所有企业?是直接开放原生数据还是开放基于数据挖掘的某些统计结果?显然,这些问题都没有统一答案,需要边走边看。
规则界定之前,政府开放大数据更倾向于“大公司优先”
政府开放大数据当前的案例主要是面向阿里、百度这样的互联网巨头。在一些中小创业型公司看来,这难免会有些“不公平”。不过仔细想想,大公司优先或许是必经之路。
首先,大公司具有更强的技术能力和资源。阿里巴巴给外界的印象是电商,其实它同时也是技术大牛,阿里云是最大的公有云平台,并且其面向大数据推出了ODPS(开放大数据处理服务)。同样,百度是技术驱动的互联网巨头,率先提供了大数据开放引擎,建立了大数据实验室。在这两家公司大数据已经是公司战略。它们有技术,肯投入资源利用大数据。如果说只能逐步开放大数据给不同企业,分批选择企业有限选择技术更强、资源更多的大公司合情合理。
其次,大公司在大数据隐私保护上更可靠。由于政府大数据不少涉及到国计民生,不少关乎公民隐私,比如健康数据、出行数据、信用数据等等。因此政府在开放大数据服务于民的同事,必须严格把关数据的使用者以及使用方式,避免出现公民隐私被侵犯的情况。如果不涉及公民隐私的数据直接开放自然没问题,但涉隐数据,自然要选择可靠的使用者。从概率上来看,声誉好的大公司出现问题的概率最小。这与普通用户选择个人云存储、个人邮箱、网络支付工具等涉及隐私服务,会优先考虑大公司,是一个道理。
再次,面向中小企业的数据开放必须通过系统。就算政府一些数据可以公开给任何符合条件的企业使用,也不大可能是“点对点”的方式,即不是签协议战略合作这类方式,而是基于开放式的数据开放平台,可能是公共API,也可能是美国政府的“DATA.GOV”这样的形式,只有这样才能一次开放多家使用。谈判、合作、协商、协议,这些都只适合针对个别企业的合作。因此眼下这样的可以整合不同政府部门相关数据的开放平台建设,已迫在眉睫。不过在建好之前,只能是大企业优先,与大企业的合作只会为后续的进一步开放提供宝贵的实践经验。
最后,大企业并非无偿使用数据还要贡献价值。还有一个重要的原因是,BAT等大企业本身便拥有海量大数据。这些数据来自中国网民的网购理财、来自用户社交搜索等等。2014年9月19日,国家统计局首次对外展示了其正在研究的基于百度搜索数据来预测房地产价格的新工具,以及新研发的网购数据统计,而其数据来源之一则是阿里巴巴。腾讯也在统计局的潜在数据源提供方名单之中。就是说,政府一方面要开放自己的大数据,另一方面也需要从大公司拿到特定数据。除了数据贡献之外,还有技术服务。政府不擅长技术,BAT们却擅长,帮助政府部门建基础设施、建开放平台、开发数据挖掘工具,在这一块的合作案例已经够多了。
从长远来看,政府开放大数据是必然趋势,取之于民用之于民。不过全面开放、完善开放规则还需要一个过程。在当前的个例式开放模式中,政府部门似乎更倾向于“大公司优先”。我想这只是暂时的,未来更多中小企业、以及政府所鼓励的创业者,都会享受到“大数据红利”,现在还需要多一点耐心。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22