
大数据垄断怎么破
永恒的是变化本身。最新例子是,数据已类似石油和电力,成为世界上关键的战略性基础资源。
两会议程过半,大数据开放成了热门词。这一热点背后,是中国大数据发展处在起步阶段,不少基础性、关键性数据仍被众多部门和机构束之高阁,少数大型互联网垄断企业为追求利益最大化,以安全和企业机密等原因拒绝向社会提供关键数据,整个国家数据共享开放程度不高。
“现阶段所存在的数据平台,主要以政府相关部门、大型互联网公司为主,具有较强的层级性、区域性和单一性,对于社会治理和企业发展的帮助极其有限。”全国人大代表、苏宁控股集团(苏宁)董事长张近东在一份关于数据共享的建议中如此表述。
张近东的建议是,建立国家级跨地域、跨行业的开放数据统一管理平台。全国人大代表、腾讯公司(腾讯)董事会主席兼首席执行官马化腾也持类似看法,他建议,实现数字资源整合,用好用满现有的数字基础设施,加快数字中国建设进程。
开放数据成为政策建议的热点背后,是互联网巨头凭借着数据优势,获得了特殊地位,从而谋得巨额利润。
正如《经济学人》在去年5月初发表的“监管数据经济”一文中指出,互联网公司对数据的控制,使之掌握了巨大权力,而这一权力,使得巨头的监控系统覆盖整个经济领域。“2018年,将是大数据从技术阶段向应用阶段高速发展的一年。大数据未来在物联网、区块链、智慧城市、AR、VR、AI、语音识别等领域都值得关注。”关于大数据潜力,张近东以书面形式如此回复经济观察报记者。
建议
政务大数据开放已在政策日程之中。
去年5月18日,国务院办公厅印发《政务信息系统整合共享实施方案》,方案指出, 推进政务信息化“五位一体”总体布局和协调推进“四个全面”战略布局,有效推进政务信息系统整合共享,切实避免各自为政、自成体系、重复投资、重复建设。
在前述方案中,还提出了包括消除“僵尸”信息系统、加快部门内部信息系统整合共享、提升国家统一电子政务网络支撑能力、接入统一数据共享交换平台、加快公共数据开放网站建设、推进全国政务信息共享网站建设等在内的“十件大事”。
此外,上述方案明确,要在今年6月底前,实现国务院各部门整合后的政务信息系统,统一接入国家数据共享交换平台,各地区结合实际,统筹推进本地区政务信息系统整合共享工作,初步实现国务院部门和地方政府信息系统互联互通。
工信部总工程师张峰在去年5月17日举行的“2017年世界电信和信息社会日”大会上提到,“中国将建设全国一体化的国家大数据中心,推进公共数据开放和基础数据资源跨部门、跨区域共享”。
政策暖风下,数据开放逐步指向社会数据。张近东建议,国家应加快顶层设计和统筹规划,中央政府牵头,参考银联、网联模式,以企业机构为建设和运营主体,将政府、社会的数据汇聚和管理,建立国家级的跨地域、跨行业的开放数据统一管理平台,为数据应用创造有利条件。
张近东还建议,把数据平台的建设作为重要公共基础设施,引导社会各行各业实现数据开放共享,对于数据资源的管理和供给,参考水电对于国家经济的基础,采取低价、充足的策略。
马化腾则更关注于公共数据的开放。他建议,充分利用现有数据平台,打破部门和地区壁垒,实现数字资源整合,同时,马化腾建议,借鉴国外先进经验,制定统一的公共数据开放规则。“在条件具备的部门或地区,示范建设公共数据开放平台和数据产品流转平台。可以在此基础上,进一步摸索出适合中国国情的公共数据开放战略。”
对于数据平台运营,马化腾亦提出了自己的想法。他建议,加强数据相关市场机制建设,维护健康有序的市场竞争秩序。“建立健全数据市场体系和交易机制,是发挥市场在数据要素配置过程中的主导作用的前提。”
纠葛
海量的数据变化改变了竞争。科技巨头始终受益于网络效应,例如,注册Facebook的用户越多,就越能吸引其他人注册。而这些数据又会构成额外的网络效应。通过收集更多的数据,企业便可改进自家产品,从而吸引更多用户,甚至生成更多数据。海量数据可以充当企业的护城河。
另一方面,数据也可以成为抵抗竞争对手的方式。在科技行业,人们之所以对竞争怀有期望,是因为某个创业公司可能击败老牌企业,也有可能出现意料之外的技术变革。但在数据时代,这两种可能性都大幅降低。
前述《经济学人》报道称,巨头的监控系统覆盖整个经济。比如,谷歌可以看到人们搜索什么,Facebook知道你在分享什么,亚马逊对你的购物习惯了如指掌。“他们拥有应用商店、操作系统,还向创业公司出租计算资源。他们可以监控自己的市场和其他市场。他们能够看到哪些新产品和新服务受到追捧,因而能够及时模仿,甚至直接收购,避免遭遇更大的威胁。”
张近东的建议背后,就是这一趋势的持续发展。他直指,应开放数据,让广大中小型企业,能够与部分已经具有领先优势的巨型企业,在数据领域站在同一起跑线上,“打破数据壁垒,杜绝数据垄断。”
对中小型企业,大数据确实起着重要作用。有零售行业创业者向记者坦言,想在这一行创业,只有去巨头们看不上的细分市场,“数据的事绕不开,所以只能打造小领域的小生态,我们有跟BAT谈过,目前保持独立,至于未来(是否接受巨头入股),也不知道。”
另一头,不惟中小型企业,巨头们亦为数据之战打得不可开交,去年中的“顺丰、菜鸟网络(菜鸟)之争”便是明证。
去年6月1日,菜鸟下线顺丰旗下快递柜系统丰巢的接口信息,同时,顺丰关闭了自提柜的数据信息回传。最终,在国家邮政总局的调节下,顺丰、菜鸟双方同意于6月3日12时起,全面恢复业务合作和数据传输。此次争议的焦点在于,顺丰指称菜鸟要求其提供非淘系(非阿里巴巴电商平台)数据;菜鸟方面则坚称,在过去的合作中,顺丰大量查询和使用丰巢中非顺丰的数据,远远超出了正常使用范围。
国金证券的一份报告就此分析,此次“丰鸟之争”的主要核心关键在于对数据的争夺。数据在未来,对于提升快递服务质量、提升快递企业盈利能力具有重要作用。”商业竞争的本质是供应链之争,而大数据的获取分析,是现代供应链竞争基础。 ”
行业内对于数据的敏感性,亦深有感触。去年11月,苏宁易购副董事长孙为民向经济观察报记者披露,苏宁物流与阿里在物流数据交互上有所保留。“数据的主体属于消费者自己,每一个企业或者说平台,都有相应的接口。把数据全都给他们(阿里),对消费者权益也是不尊重的。”
去路
基于上述种种原因,数据开放,渐成大势,但也面临着种种问题。
其中之一是,数据管理缺少规范和标准,同时,数据开放安全性存疑。张近东的建议是,展开数据领域的立法工作,通过人大立法机构,成立立法推进委员会,加快数据采集、开放、共享、安全、使用和隐私保护方面的立法,建立数据标准、界定数据边界,确实有效地建立数据领域的法制基础。“以法律的形式对平台数据进行分级的有效管理,并规范数据资源开放和共享的内容及形式,形成完善的综合治理体系,提供公平公正安全可靠的环境。”
张近东还提出,在共建社会数据开放共享平台的过程中,可以逐步加大引入人工智能和区块链技术,推动大数据与人工智能、区块链等新技术的融合,利用技术融合优势,提高对风险因素的感知、预测、防范能力。
另一头,对于可能存在的巨头数据“垄断”等问题,《经济学人》指出,反垄断官员可以通过企业的数据资产来评估交易影响。“交易价格也会成为一个信号,帮助其判断老牌企业是否在通过收购排除威胁。”
此外,降低在线服务提供商对数据的控制权,让数据提供者掌握更大的控制,强迫企业向消费者披露他们所拥有的数据,以及他们借此获取的收入等。亦是《经济学人》的建议之一
值得一提的是,已有企业在数据开放中看到商机。全国政协委员、京东集团(京东)董事局主席兼首席执行官刘强东就建议,推进政府采购全流程电子化,提升政府采购效率和透明度、发挥大数据技术辅助决策作用,提升政府采购决策水平、加强与电商大数据对接,完善现代化监管手段。
京东本身亦在政府采购中收获颇丰。京东企业购官网显示,京东企业采购业务陆续达成了与中央政府采购、江苏省政府、广东省政府、北京市政府、上海市政府等众多大型政府和企业的采购合作,截止2016年底,京东平台现有活跃企业客户数超600万。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01