
大数据最值钱 马云爆"数据是阿里最值钱的财富"
4月14日,一桩买卖引发了人们的好奇。大电商京东成了买家,卖家是腾讯等公司,买卖的东西是——大数据。而为这桩买卖提供平台的贵阳大数据交易所,作为全国首个大数据交易所,也于当日正式挂牌成立。
这笔交易很新奇,但还只是商业数据交易,目前,不少政府也开始接触大数据交易平台。政府手里攥着的纳税数据、公积金数据,是许多企业渴求已久的,但是这些数据是否涉及隐私?大数据具体如何交易?大数据交易作为一个新生事物,有很多值得探讨的地方,为此,本报采访了多位业内人士。
(1)政府大数据作为“原料”不收费
4月10日,中关村大数据交易产业联盟秘书长、北京数海科技有限公司(简称“数海科技”)董事长秦翯第一时间在“朋友圈”分享了一条消息:“我们今年计划和地方政府合作建设10家区域性的大数据交易平台。”
政府拥抱大数据,很前卫;但政府售卖数据,合适吗?对此,秦翯向本报解释说,由于数据权属的问题,政府数据是不能用来交易的。政府的数据是全体公民的贡献,因此政府无权将其出售,从而获取商业报酬。
业内人士指出,政府数据本身是免费的,数据公司跟地方政府合作,对政府提供的免费数据“原料”进行加工,以便更好地向需求方提供数据。而加工过程的成本,可能成为未来大数据交易的费用。
“政府数据开放需要对大量的数据进行加工、清洗和处理,然而这部分经费并不在政府的财政规划当中,因而大数据交易平台要做的是与政府合作,帮助地方政府把这些高价值的数据开放给全社会。” 秦翯说。
在百融(北京)金融信息服务股份有限公司高级总监段莹看来,政府愿意参与大数据交易有两大驱动力:一方面,市场渴望将政府巨大的数据资源作为依托;另一方面,政府也想要开放数据资源以促进产业转型升级。
秦翯提供的数据显示,政府直接或间接持有的数据资源占比超过80%,剩余的商业公司持有的只占20%。在政府持有的数据资源中,公共体系只是一部分,另外一部分则在公共基础设施如医疗、水电煤等领域中。“政府数据开放是未来大数据时代需要开发的一片大油田。” 秦翯说。
百融集团华北区创新合作部总监朱奔向本报表示:“从数据的质量和数据的规格来看,政府数据比商业数据更具有价值。”段莹进一步解释说:“比如说纳税数据、公积金数据、社保数据、房产数据等,都能帮助金融机构降低对个人信用的评估成本。”
政府大数据的确很诱人,但是,政府参与大数据交易平台却面临一道法律屏障。据悉,目前国家层面还没有明确数据开放的相关事宜。“我们现在特别希望国家能够出台隐私法等相应的法律法规,为有开放意愿的数据持有方提供必要的政策支持和决策依据。虽然这个过程可能会很漫长、很艰难,但不管怎么说,政府数据能够被开放出来,对整个社会的发展都是一件非常好的事情。”段莹表示。
虽然有障碍,但是各地已经开始了探索。秦翯介绍说,他们已经与重庆等地政府签订了战略合作协议,帮助他们建设大数据平台,将政府体系的数据分级分度地开放开发出来。
(2)大数据资产未来最值钱
去年10月,马云爆出金句:“我们是通过卖东西收集数据,数据是阿里最值钱的财富。”在一个月之后的演讲中,他直言阿里巴巴公司本质上是一家数据公司,“我们做淘宝的目的不是为了卖货,而是获得所有零售的数据和制造业的数据;我们做阿里小微金服的目的,是建立信用体系;我们做物流不是为了送包裹,而是把这些数据合在一起。”
马云的话有些玄妙,在秦翯看来,像阿里巴巴这样的大公司,其对每个用户的评价大概会有2000多个参数,通过对这些数据进行整合和分析,很容易得出对用户信用情况的基本判断。
收集数据显然不是目的,目的是卖数据。目前,大数据交易有三个品种:源数据、数据产品以及数据工具或数据模型。秦翯举了一个很形象的例子。假如你有一堆土豆,你把它们直接卖掉,这叫做源数据交易;你把它们切好后炸成薯条卖掉,这叫做数据产品交易;如果你炸的薯条特别好吃,卖得也特别好,并像麦当劳那样将经营模式推广至全球,这时你就是在完成数据模型的交易。
要售卖就要有价格。对于大数据的定价,段莹认为,数据的定价同样要基于实际应用的场景。他解释说,一个用户去买一台洗衣机的数据和他在银行信用借款的数据该怎么定价呢?这就需要一定的场景来实现:比如没有这些数据,银行发放信用卡或个人贷款时很有可能就将这个人筛掉,于是银行便损失掉这个客户。但客户是需要银行花成本营销过来的。如果有了这个数据,便可以节约对该客户的营销成本。这些数据的价格可以根据其应用价值和节约成本测算出来。
有了产品,也有了定价,具体怎么卖?据介绍,目前大数据交易方式主要有在线、离线和托管3种。在线的方式类似于网上购物,买卖双方借助交易平台达成交易;离线的方式适用于大型的历史性数据,这类数据不适宜在线传送,所以一般采取线下一次性交割的方式;托管的方式就是数据提供方将数据交由交易平台管理,一旦有用户请求购买,交易平台可以直接完成数据的配送。
除了这些常规方式,秦翯所在的公司还想出了拍卖的方式。秦翯解释说,一些新兴企业破产后,没有很多的固定资产,其最大的资产便是数据。我们很快要成立数据资产评估中心,一旦这些企业在我们的评估中心登记了资产,我们会为其提供破产清算,把他们的数据资产放到平台上进行拍卖,再由需求者竞价购置。
(3)交易要有规则不得侵犯隐私
将“数据”与“交易”这两个词放在一起,很多人首先联想到的恐怕就是诈骗电话、恶性推销等社会乱象。因此,大数据交易最不能回避的就是隐私问题。
在秦翯看来,乱象产生的根源不在交易而在规则。“在大数据交易平台正式搭建之前,数据信息被私下交易的情况便已十分普遍。根据我们日常生活的经验,诈骗电话及恶性广告推销等行为都是不良数据交易引发的信息泄露所带来的恶果。然而这些弊端的产生并不是由于数据交易本身造成的,而是由交易规则体系不完善造成的。”秦翯说。
段莹表示,如果不想造成侵犯,在交易之前,数据供需双方就必须要明确什么样的数据可以进行交易,什么样的不可以。目前问题在于中国没有隐私法,很多数据是否涉及隐私很难界定。
国外是否有经验可循?秦翯介绍说,美国很早就从国家层面形成了强有力的有关数据资产的法律体系。有的国家已经处在探讨数据资产化的阶段,比如法国出台数字经济纳税条例,对享有公民免费数据的互联网企业增加一些税种。
由于没有全面覆盖的法律,秦翯所在的公司便临时制定了一个规则,试图规避一些在数据交易过程中潜在的风险。“我们将在今年4月底发布全国第一个中关村数据资产评估中心,该中心将赋予数据20多项权益,突破此前单纯的物产概念,将数据纳入知识产权、虚拟财产权(资本利得权)和财产权(物权)三位一体的数据权益体系,多维度区分不同形态和层级,建立新时代背景下的大数据产权制度,帮助数据交易畅通无阻地进行。”秦翯说。
当然,有些简单的方式也可以解决隐私问题,那就是选择适当的大数据交易品种。借用之前的比喻,如果我们直接出售土豆,卖家或许可以判断出品种、产地等“土豆隐私”,而如果我们将土豆做成薯条出卖,这些隐私就不会泄露出去了。“我们不是交易底层数据,而是交易数据分析的结果。”贵阳大数据交易所总裁王叁寿表示,前者系信息泄露,属于违法行为;而后者则可以在合法范围内为客户提供建模分析,用以指导其部署决策、制定营销计划和战略规划等。
此外,贵阳大数据交易所实现会员制,严格控制交易所的会员准入制度,申请加入交易所的会员必须接受严格的资质及信誉审查,保证了数据的质量及数据不被滥用。
(4)中国大数据前景在传统产业
“贵阳大数据交易所能让中国诞生一个上万亿产值的新产业,大数据交易所作为其中的推动者、引领者,带动整个中国大数据产业的发展。”王叁寿表示,中国乃至全球都在思考数据的价值。
作为大数据交易行业的先行者,秦翯认为中国的数据交易在未来必会走出一条与国外不同的发展道路。据秦翯介绍,国外很早就有政府数据开放平台和数据交易平台,只是最终都已转型。这其中的原因比较复杂。以美国为例,提供数据交易的公司很多,美国有比较强大的征信体系,而征信公司本身就是一个巨大的数据融合平台,可以对居民衣食住行等各个方面的数据加以整合并对其进行综合评价。秦翯认为,“就整体而言,国内数据开放的渠道还不够通畅,即便有区域性的数据开放也没能形成有效的融合,因而存在割裂化和碎片化的问题。但这些都是大数据交易在发展过程中呈现出的阶段性特征,需要逐步去解决。”
“基于我国国情,大数据交易在寻求高效有序发展路径时,必须要依托政府和市场的双重力量。在大数据交易方面发展较快的互联网金融以及电子商务行业,应发挥自身的先导作用,通过搭建数据交易平台等方式积极与政府进行合作,助力政府数据资源的开放和共享。同时,政府也应鼓励和支持企业在大数据交易领域所做的积极尝试。”秦翯说。
朱奔也有着相同的看法:“如果没有市场竞争机制的刺激,政府数据开放的过程也将被大大延长;反之,如果没有政府的引导,只靠市场行为是很难推动全社会数据开放及数据共享的。”
大数据起源于互联网与电子商务,因此,这些领域率先进行了大数据交易;但是,业内人士指出,随着大数据交易在整个社会的不断推进,医疗、交通、钢铁等产业会成为未来最大的亮点。
“大数据交易最大的应用前景在传统产业。这不仅是由于几乎所有传统产业都在互联网化,更是因为传统产业仍然占据了国内生产总值的绝大部分份额。大数据交易会帮助这些传统产业更快地完成转型升级,进而通过大数据的融合的调度推动智慧城市的建设。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
如何考取数据分析师证书:以 CDA 为例 在数字化浪潮席卷各行各业的当下,数据分析师已然成为企业挖掘数据价值、驱动决策的 ...
2025-07-15CDA 精益业务数据分析:驱动企业高效决策的核心引擎 在数字经济时代,企业面临着前所未有的数据洪流,如何从海量数据中提取有 ...
2025-07-15MySQL 无外键关联表的 JOIN 实战:数据整合的灵活之道 在 MySQL 数据库的日常操作中,我们经常会遇到需要整合多张表数据的场景 ...
2025-07-15Python Pandas:数据科学的瑞士军刀 在数据驱动的时代,面对海量、复杂的数据,如何高效地进行处理、分析和挖掘成为关键。 ...
2025-07-15用 SQL 生成逆向回滚 SQL:数据操作的 “后悔药” 指南 在数据库操作中,误删数据、错改字段或误执行批量更新等问题时有发生。 ...
2025-07-14t检验与Wilcoxon检验的选择:何时用t.test,何时用wilcox.test? t 检验与 Wilcoxon 检验的选择:何时用 t.test,何时用 wilcox. ...
2025-07-14AI 浪潮下的生存与进阶: CDA数据分析师—开启新时代职业生涯的钥匙(深度研究报告、发展指导白皮书) 发布机构:CDA数据科 ...
2025-07-13LSTM 模型输入长度选择技巧:提升序列建模效能的关键 在循环神经网络(RNN)家族中,长短期记忆网络(LSTM)凭借其解决长序列 ...
2025-07-11CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-11数据透视表中两列相乘合计的实用指南 在数据分析的日常工作中,数据透视表凭借其强大的数据汇总和分析功能,成为了 Excel 用户 ...
2025-07-11尊敬的考生: 您好! 我们诚挚通知您,CDA Level I和 Level II考试大纲将于 2025年7月25日 实施重大更新。 此次更新旨在确保认 ...
2025-07-10BI 大数据分析师:连接数据与业务的价值转化者 在大数据与商业智能(Business Intelligence,简称 BI)深度融合的时代,BI ...
2025-07-10SQL 在预测分析中的应用:从数据查询到趋势预判 在数据驱动决策的时代,预测分析作为挖掘数据潜在价值的核心手段,正被广泛 ...
2025-07-10数据查询结束后:分析师的收尾工作与价值深化 在数据分析的全流程中,“query end”(查询结束)并非工作的终点,而是将数 ...
2025-07-10CDA 数据分析师考试:从报考到取证的全攻略 在数字经济蓬勃发展的今天,数据分析师已成为各行业争抢的核心人才,而 CDA(Certi ...
2025-07-09【CDA干货】单样本趋势性检验:捕捉数据背后的时间轨迹 在数据分析的版图中,单样本趋势性检验如同一位耐心的侦探,专注于从单 ...
2025-07-09year_month数据类型:时间维度的精准切片 在数据的世界里,时间是最不可或缺的维度之一,而year_month数据类型就像一把精准 ...
2025-07-09CDA 备考干货:Python 在数据分析中的核心应用与实战技巧 在 CDA 数据分析师认证考试中,Python 作为数据处理与分析的核心 ...
2025-07-08SPSS 中的 Mann-Kendall 检验:数据趋势与突变分析的有力工具 在数据分析的广袤领域中,准确捕捉数据的趋势变化以及识别 ...
2025-07-08备战 CDA 数据分析师考试:需要多久?如何规划? CDA(Certified Data Analyst)数据分析师认证作为国内权威的数据分析能力认证 ...
2025-07-08