
政府开放大数据,规则界定前大公司优先
大数据终于不再是纸上谈兵,而是进入到实际应用阶段,标志性事件是两会上,李克强总理明确表态,政府应该尽量的公开非涉密的数据,以便利用这些数据更好的服务社会,也为政府决策和监管服务。这是中国政府首次正式公开表态支持大数据。
在此之前中国各级政府一些部门已在大数据开放上有所尝试,从实际情况来看,还存在开放规则不明朗的问题,不过一个大方向确实:大公司优先。
政府部门大数据成为企业眼里的“香饽饽”
大数据是金矿,企业和政府都已经意识到其中的价值,在大数据上有野心的企业都期望获得更多有价值的数据,可能是来自其用户,可能是来自合作伙伴,还有一个重要来源是政府等组织机构的公开数据。 不同来源不同性质的数据关联在一起交叉挖掘分析,会发生“化学反应”得到更多价值。阿里巴巴拿到微博数据可以挖掘做好精准营销、拿到交通部门数据可以与菜鸟网络结合、拿到金融监管部门数据便可与用户交易和理财记录结合做个人征信;百度拿到交通部门数据可以与百度地图结合、拿到博彩指数公司数据结合网络数据做世界杯预测……
2015年开始中国政府对互联网、高科技和大数据产业的空前重视,并且明确表态要开放大数据,因此势必会有更多的政府数据开放给民间。这些大数据成为相关企业眼里的“香饽饽”。这些数据如何开放、开放给谁、如何使用,却还不明朗。
政府大数据使用权尚不明朗,需边走边看
阿里、百度这两家中国最积极的大数据玩家,过去便与一些政府部门接入了大数据。
2013年2月25日,国家食品药品监督管理局与百度在北京联合举行“安全用药,搜索护航”战略合作签约仪式。国家药监局的三大药品数据库,总计20余万个权威药品信息全面入驻百度。
2014年5月27日,中国气象局公共气象服务中心与阿里云达成战略合作,共同搭建“中国气象专业服务云”,面向有气象数据需求的企业提供专业化的云计算服务。
2014年7月23日,百度推出名为“北京健康云”的智能医疗平台产品,这是北京市政府支持推动下的一个民生医疗项目。
2014年10月15日,“云上贵州”系统平台正式开通运行,这是贵州省政府与阿里牵头的企业合建的云计算基础设施,应用在交通等领域。
2015年1月13日,阿里健康宣布将药品监管网的基础设施从甲骨文数据库迁移到阿里云平台,阿里将利用大数据技术帮助解决假药问题。
政府在大数据上已经动了起来,百度和阿里成为第一批吃螃蟹者。问题是,这些数据不只是它们想要,阿里和百度之间有竞争关系不说,还有不少相关企业都有拿到这些数据的诉求。 比如药监局的药品数据库,百度和阿里先后拿到之后,便有医学药学生命科学专业网站“丁香园”站出来表示,这些数据应该以公平的方式开放给更多企业,以达到数据安全,市场公平和效率最高的目的。显然在纷纷认识到大数据的重要性之后,围绕大数据的争抢已经展开。
美国政府在大数据开放上有着先进的经验,《大数据》这一大数据启蒙教材的主要案例便是围绕美国政府大数据的开放案例,这本书曾被副总理汪洋公开推荐给官员。“用纳税人的钱收集的数据应该免费提供给纳税人使用”书中提及的一个观点。
不过,道理简单,操作却并不可一蹴而就:哪些数据是可以开放的(李克强总理提到非涉密数据,不知道是否已有明确界定规则)?开放的程度是怎样的?开放的方式如何:是面向特定企业开放还是建设系统纳入统一数据开放平台之中?是有偿开放给企业还是免费开放给所有企业?是直接开放原生数据还是开放基于数据挖掘的某些统计结果?显然,这些问题都没有统一答案,需要边走边看。
规则界定之前,政府开放大数据更倾向于“大公司优先”
政府开放大数据当前的案例主要是面向阿里、百度这样的互联网巨头。在一些中小创业型公司看来,这难免会有些“不公平”。不过仔细想想,大公司优先或许是必经之路。
首先,大公司具有更强的技术能力和资源。阿里巴巴给外界的印象是电商,其实它同时也是技术大牛,阿里云是最大的公有云平台,并且其面向大数据推出了ODPS(开放大数据处理服务)。同样,百度是技术驱动的互联网巨头,率先提供了大数据开放引擎,建立了大数据实验室。在这两家公司大数据已经是公司战略。它们有技术,肯投入资源利用大数据。如果说只能逐步开放大数据给不同企业,分批选择企业有限选择技术更强、资源更多的大公司合情合理。
其次,大公司在大数据隐私保护上更可靠。由于政府大数据不少涉及到国计民生,不少关乎公民隐私,比如健康数据、出行数据、信用数据等等。因此政府在开放大数据服务于民的同事,必须严格把关数据的使用者以及使用方式,避免出现公民隐私被侵犯的情况。如果不涉及公民隐私的数据直接开放自然没问题,但涉隐数据,自然要选择可靠的使用者。从概率上来看,声誉好的大公司出现问题的概率最小。这与普通用户选择个人云存储、个人邮箱、网络支付工具等涉及隐私服务,会优先考虑大公司,是一个道理。
再次,面向中小企业的数据开放必须通过系统。就算政府一些数据可以公开给任何符合条件的企业使用,也不大可能是“点对点”的方式,即不是签协议战略合作这类方式,而是基于开放式的数据开放平台,可能是公共API,也可能是美国政府的“DATA.GOV”这样的形式,只有这样才能一次开放多家使用。谈判、合作、协商、协议,这些都只适合针对个别企业的合作。因此眼下这样的可以整合不同政府部门相关数据的开放平台建设,已迫在眉睫。不过在建好之前,只能是大企业优先,与大企业的合作只会为后续的进一步开放提供宝贵的实践经验。
最后,大企业并非无偿使用数据还要贡献价值。还有一个重要的原因是,BAT等大企业本身便拥有海量大数据。这些数据来自中国网民的网购理财、来自用户社交搜索等等。2014年9月19日,国家统计局首次对外展示了其正在研究的基于百度搜索数据来预测房地产价格的新工具,以及新研发的网购数据统计,而其数据来源之一则是阿里巴巴。腾讯也在统计局的潜在数据源提供方名单之中。就是说,政府一方面要开放自己的大数据,另一方面也需要从大公司拿到特定数据。除了数据贡献之外,还有技术服务。政府不擅长技术,BAT们却擅长,帮助政府部门建基础设施、建开放平台、开发数据挖掘工具,在这一块的合作案例已经够多了。
从长远来看,政府开放大数据是必然趋势,取之于民用之于民。不过全面开放、完善开放规则还需要一个过程。在当前的个例式开放模式中,政府部门似乎更倾向于“大公司优先”。我想这只是暂时的,未来更多中小企业、以及政府所鼓励的创业者,都会享受到“大数据红利”,现在还需要多一点耐心。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
评判两组数据与初始数据准确值的方法 在数据分析与研究中,我们常常会面临这样的情况:需要对通过不同方法、不同过程得到的两组 ...
2025-08-01通过 COX 回归模型诊断异常值 一、COX 回归模型概述 COX 回归模型,又称比例风险回归模型,是一种用于生存分析的统计方法。它能 ...
2025-08-01CDA 数据分析师报考条件详解:迈向专业认证的指南 在数据分析行业蓬勃发展的当下,CDA 数据分析师认证成为众多从业者提升专业 ...
2025-08-01K-S 曲线、回归与分类:数据分析中的重要工具 在数据分析与机器学习领域,K-S 曲线、回归和分类是三个核心概念与工具,它们各 ...
2025-07-31大数据时代对定性分析的影响 在大数据时代,海量、多样、高速且低价值密度的数据充斥着我们的生活与工作。而定性分析作为一 ...
2025-07-31CDA含金量分析 在数字经济与人工智能深度融合的时代,数据驱动决策已成为企业核心竞争力的关键要素。CDA(Certified Data Analys ...
2025-07-31SASEM 决策树:理论与实践应用 在复杂的决策场景中,如何从海量数据中提取有效信息并制定科学决策,是各界关注的焦点。SASEM 决 ...
2025-07-30SPSS 语法使用详解 在当今数据驱动的时代,SPSS( Statistical Package for the Social Sciences)作为一款功能强大的统计分析软 ...
2025-07-30人工智能对CDA数据分析领域的影响 人工智能对 CDA(Certified Data Analyst,注册数据分析师)数据分析领域的影响是全方位、多层 ...
2025-07-30MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-29左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-29CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-29CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-29解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-29解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-29鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-29用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-29从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-29CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-29解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-29