京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据最值钱 马云爆"数据是阿里最值钱的财富"
4月14日,一桩买卖引发了人们的好奇。大电商京东成了买家,卖家是腾讯等公司,买卖的东西是——大数据。而为这桩买卖提供平台的贵阳大数据交易所,作为全国首个大数据交易所,也于当日正式挂牌成立。
这笔交易很新奇,但还只是商业数据交易,目前,不少政府也开始接触大数据交易平台。政府手里攥着的纳税数据、公积金数据,是许多企业渴求已久的,但是这些数据是否涉及隐私?大数据具体如何交易?大数据交易作为一个新生事物,有很多值得探讨的地方,为此,本报采访了多位业内人士。
(1)政府大数据作为“原料”不收费
4月10日,中关村大数据交易产业联盟秘书长、北京数海科技有限公司(简称“数海科技”)董事长秦翯第一时间在“朋友圈”分享了一条消息:“我们今年计划和地方政府合作建设10家区域性的大数据交易平台。”
政府拥抱大数据,很前卫;但政府售卖数据,合适吗?对此,秦翯向本报解释说,由于数据权属的问题,政府数据是不能用来交易的。政府的数据是全体公民的贡献,因此政府无权将其出售,从而获取商业报酬。
业内人士指出,政府数据本身是免费的,数据公司跟地方政府合作,对政府提供的免费数据“原料”进行加工,以便更好地向需求方提供数据。而加工过程的成本,可能成为未来大数据交易的费用。
“政府数据开放需要对大量的数据进行加工、清洗和处理,然而这部分经费并不在政府的财政规划当中,因而大数据交易平台要做的是与政府合作,帮助地方政府把这些高价值的数据开放给全社会。” 秦翯说。
在百融(北京)金融信息服务股份有限公司高级总监段莹看来,政府愿意参与大数据交易有两大驱动力:一方面,市场渴望将政府巨大的数据资源作为依托;另一方面,政府也想要开放数据资源以促进产业转型升级。
秦翯提供的数据显示,政府直接或间接持有的数据资源占比超过80%,剩余的商业公司持有的只占20%。在政府持有的数据资源中,公共体系只是一部分,另外一部分则在公共基础设施如医疗、水电煤等领域中。“政府数据开放是未来大数据时代需要开发的一片大油田。” 秦翯说。
百融集团华北区创新合作部总监朱奔向本报表示:“从数据的质量和数据的规格来看,政府数据比商业数据更具有价值。”段莹进一步解释说:“比如说纳税数据、公积金数据、社保数据、房产数据等,都能帮助金融机构降低对个人信用的评估成本。”
政府大数据的确很诱人,但是,政府参与大数据交易平台却面临一道法律屏障。据悉,目前国家层面还没有明确数据开放的相关事宜。“我们现在特别希望国家能够出台隐私法等相应的法律法规,为有开放意愿的数据持有方提供必要的政策支持和决策依据。虽然这个过程可能会很漫长、很艰难,但不管怎么说,政府数据能够被开放出来,对整个社会的发展都是一件非常好的事情。”段莹表示。
虽然有障碍,但是各地已经开始了探索。秦翯介绍说,他们已经与重庆等地政府签订了战略合作协议,帮助他们建设大数据平台,将政府体系的数据分级分度地开放开发出来。
(2)大数据资产未来最值钱
去年10月,马云爆出金句:“我们是通过卖东西收集数据,数据是阿里最值钱的财富。”在一个月之后的演讲中,他直言阿里巴巴公司本质上是一家数据公司,“我们做淘宝的目的不是为了卖货,而是获得所有零售的数据和制造业的数据;我们做阿里小微金服的目的,是建立信用体系;我们做物流不是为了送包裹,而是把这些数据合在一起。”
马云的话有些玄妙,在秦翯看来,像阿里巴巴这样的大公司,其对每个用户的评价大概会有2000多个参数,通过对这些数据进行整合和分析,很容易得出对用户信用情况的基本判断。
收集数据显然不是目的,目的是卖数据。目前,大数据交易有三个品种:源数据、数据产品以及数据工具或数据模型。秦翯举了一个很形象的例子。假如你有一堆土豆,你把它们直接卖掉,这叫做源数据交易;你把它们切好后炸成薯条卖掉,这叫做数据产品交易;如果你炸的薯条特别好吃,卖得也特别好,并像麦当劳那样将经营模式推广至全球,这时你就是在完成数据模型的交易。
要售卖就要有价格。对于大数据的定价,段莹认为,数据的定价同样要基于实际应用的场景。他解释说,一个用户去买一台洗衣机的数据和他在银行信用借款的数据该怎么定价呢?这就需要一定的场景来实现:比如没有这些数据,银行发放信用卡或个人贷款时很有可能就将这个人筛掉,于是银行便损失掉这个客户。但客户是需要银行花成本营销过来的。如果有了这个数据,便可以节约对该客户的营销成本。这些数据的价格可以根据其应用价值和节约成本测算出来。
有了产品,也有了定价,具体怎么卖?据介绍,目前大数据交易方式主要有在线、离线和托管3种。在线的方式类似于网上购物,买卖双方借助交易平台达成交易;离线的方式适用于大型的历史性数据,这类数据不适宜在线传送,所以一般采取线下一次性交割的方式;托管的方式就是数据提供方将数据交由交易平台管理,一旦有用户请求购买,交易平台可以直接完成数据的配送。
除了这些常规方式,秦翯所在的公司还想出了拍卖的方式。秦翯解释说,一些新兴企业破产后,没有很多的固定资产,其最大的资产便是数据。我们很快要成立数据资产评估中心,一旦这些企业在我们的评估中心登记了资产,我们会为其提供破产清算,把他们的数据资产放到平台上进行拍卖,再由需求者竞价购置。
(3)交易要有规则不得侵犯隐私
将“数据”与“交易”这两个词放在一起,很多人首先联想到的恐怕就是诈骗电话、恶性推销等社会乱象。因此,大数据交易最不能回避的就是隐私问题。
在秦翯看来,乱象产生的根源不在交易而在规则。“在大数据交易平台正式搭建之前,数据信息被私下交易的情况便已十分普遍。根据我们日常生活的经验,诈骗电话及恶性广告推销等行为都是不良数据交易引发的信息泄露所带来的恶果。然而这些弊端的产生并不是由于数据交易本身造成的,而是由交易规则体系不完善造成的。”秦翯说。
段莹表示,如果不想造成侵犯,在交易之前,数据供需双方就必须要明确什么样的数据可以进行交易,什么样的不可以。目前问题在于中国没有隐私法,很多数据是否涉及隐私很难界定。
国外是否有经验可循?秦翯介绍说,美国很早就从国家层面形成了强有力的有关数据资产的法律体系。有的国家已经处在探讨数据资产化的阶段,比如法国出台数字经济纳税条例,对享有公民免费数据的互联网企业增加一些税种。
由于没有全面覆盖的法律,秦翯所在的公司便临时制定了一个规则,试图规避一些在数据交易过程中潜在的风险。“我们将在今年4月底发布全国第一个中关村数据资产评估中心,该中心将赋予数据20多项权益,突破此前单纯的物产概念,将数据纳入知识产权、虚拟财产权(资本利得权)和财产权(物权)三位一体的数据权益体系,多维度区分不同形态和层级,建立新时代背景下的大数据产权制度,帮助数据交易畅通无阻地进行。”秦翯说。
当然,有些简单的方式也可以解决隐私问题,那就是选择适当的大数据交易品种。借用之前的比喻,如果我们直接出售土豆,卖家或许可以判断出品种、产地等“土豆隐私”,而如果我们将土豆做成薯条出卖,这些隐私就不会泄露出去了。“我们不是交易底层数据,而是交易数据分析的结果。”贵阳大数据交易所总裁王叁寿表示,前者系信息泄露,属于违法行为;而后者则可以在合法范围内为客户提供建模分析,用以指导其部署决策、制定营销计划和战略规划等。
此外,贵阳大数据交易所实现会员制,严格控制交易所的会员准入制度,申请加入交易所的会员必须接受严格的资质及信誉审查,保证了数据的质量及数据不被滥用。
(4)中国大数据前景在传统产业
“贵阳大数据交易所能让中国诞生一个上万亿产值的新产业,大数据交易所作为其中的推动者、引领者,带动整个中国大数据产业的发展。”王叁寿表示,中国乃至全球都在思考数据的价值。
作为大数据交易行业的先行者,秦翯认为中国的数据交易在未来必会走出一条与国外不同的发展道路。据秦翯介绍,国外很早就有政府数据开放平台和数据交易平台,只是最终都已转型。这其中的原因比较复杂。以美国为例,提供数据交易的公司很多,美国有比较强大的征信体系,而征信公司本身就是一个巨大的数据融合平台,可以对居民衣食住行等各个方面的数据加以整合并对其进行综合评价。秦翯认为,“就整体而言,国内数据开放的渠道还不够通畅,即便有区域性的数据开放也没能形成有效的融合,因而存在割裂化和碎片化的问题。但这些都是大数据交易在发展过程中呈现出的阶段性特征,需要逐步去解决。”
“基于我国国情,大数据交易在寻求高效有序发展路径时,必须要依托政府和市场的双重力量。在大数据交易方面发展较快的互联网金融以及电子商务行业,应发挥自身的先导作用,通过搭建数据交易平台等方式积极与政府进行合作,助力政府数据资源的开放和共享。同时,政府也应鼓励和支持企业在大数据交易领域所做的积极尝试。”秦翯说。
朱奔也有着相同的看法:“如果没有市场竞争机制的刺激,政府数据开放的过程也将被大大延长;反之,如果没有政府的引导,只靠市场行为是很难推动全社会数据开放及数据共享的。”
大数据起源于互联网与电子商务,因此,这些领域率先进行了大数据交易;但是,业内人士指出,随着大数据交易在整个社会的不断推进,医疗、交通、钢铁等产业会成为未来最大的亮点。
“大数据交易最大的应用前景在传统产业。这不仅是由于几乎所有传统产业都在互联网化,更是因为传统产业仍然占据了国内生产总值的绝大部分份额。大数据交易会帮助这些传统产业更快地完成转型升级,进而通过大数据的融合的调度推动智慧城市的建设。”
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26