京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据最值钱 马云爆"数据是阿里最值钱的财富"
4月14日,一桩买卖引发了人们的好奇。大电商京东成了买家,卖家是腾讯等公司,买卖的东西是——大数据。而为这桩买卖提供平台的贵阳大数据交易所,作为全国首个大数据交易所,也于当日正式挂牌成立。
这笔交易很新奇,但还只是商业数据交易,目前,不少政府也开始接触大数据交易平台。政府手里攥着的纳税数据、公积金数据,是许多企业渴求已久的,但是这些数据是否涉及隐私?大数据具体如何交易?大数据交易作为一个新生事物,有很多值得探讨的地方,为此,本报采访了多位业内人士。
(1)政府大数据作为“原料”不收费
4月10日,中关村大数据交易产业联盟秘书长、北京数海科技有限公司(简称“数海科技”)董事长秦翯第一时间在“朋友圈”分享了一条消息:“我们今年计划和地方政府合作建设10家区域性的大数据交易平台。”
政府拥抱大数据,很前卫;但政府售卖数据,合适吗?对此,秦翯向本报解释说,由于数据权属的问题,政府数据是不能用来交易的。政府的数据是全体公民的贡献,因此政府无权将其出售,从而获取商业报酬。
业内人士指出,政府数据本身是免费的,数据公司跟地方政府合作,对政府提供的免费数据“原料”进行加工,以便更好地向需求方提供数据。而加工过程的成本,可能成为未来大数据交易的费用。
“政府数据开放需要对大量的数据进行加工、清洗和处理,然而这部分经费并不在政府的财政规划当中,因而大数据交易平台要做的是与政府合作,帮助地方政府把这些高价值的数据开放给全社会。” 秦翯说。
在百融(北京)金融信息服务股份有限公司高级总监段莹看来,政府愿意参与大数据交易有两大驱动力:一方面,市场渴望将政府巨大的数据资源作为依托;另一方面,政府也想要开放数据资源以促进产业转型升级。
秦翯提供的数据显示,政府直接或间接持有的数据资源占比超过80%,剩余的商业公司持有的只占20%。在政府持有的数据资源中,公共体系只是一部分,另外一部分则在公共基础设施如医疗、水电煤等领域中。“政府数据开放是未来大数据时代需要开发的一片大油田。” 秦翯说。
百融集团华北区创新合作部总监朱奔向本报表示:“从数据的质量和数据的规格来看,政府数据比商业数据更具有价值。”段莹进一步解释说:“比如说纳税数据、公积金数据、社保数据、房产数据等,都能帮助金融机构降低对个人信用的评估成本。”
政府大数据的确很诱人,但是,政府参与大数据交易平台却面临一道法律屏障。据悉,目前国家层面还没有明确数据开放的相关事宜。“我们现在特别希望国家能够出台隐私法等相应的法律法规,为有开放意愿的数据持有方提供必要的政策支持和决策依据。虽然这个过程可能会很漫长、很艰难,但不管怎么说,政府数据能够被开放出来,对整个社会的发展都是一件非常好的事情。”段莹表示。
虽然有障碍,但是各地已经开始了探索。秦翯介绍说,他们已经与重庆等地政府签订了战略合作协议,帮助他们建设大数据平台,将政府体系的数据分级分度地开放开发出来。
(2)大数据资产未来最值钱
去年10月,马云爆出金句:“我们是通过卖东西收集数据,数据是阿里最值钱的财富。”在一个月之后的演讲中,他直言阿里巴巴公司本质上是一家数据公司,“我们做淘宝的目的不是为了卖货,而是获得所有零售的数据和制造业的数据;我们做阿里小微金服的目的,是建立信用体系;我们做物流不是为了送包裹,而是把这些数据合在一起。”
马云的话有些玄妙,在秦翯看来,像阿里巴巴这样的大公司,其对每个用户的评价大概会有2000多个参数,通过对这些数据进行整合和分析,很容易得出对用户信用情况的基本判断。
收集数据显然不是目的,目的是卖数据。目前,大数据交易有三个品种:源数据、数据产品以及数据工具或数据模型。秦翯举了一个很形象的例子。假如你有一堆土豆,你把它们直接卖掉,这叫做源数据交易;你把它们切好后炸成薯条卖掉,这叫做数据产品交易;如果你炸的薯条特别好吃,卖得也特别好,并像麦当劳那样将经营模式推广至全球,这时你就是在完成数据模型的交易。
要售卖就要有价格。对于大数据的定价,段莹认为,数据的定价同样要基于实际应用的场景。他解释说,一个用户去买一台洗衣机的数据和他在银行信用借款的数据该怎么定价呢?这就需要一定的场景来实现:比如没有这些数据,银行发放信用卡或个人贷款时很有可能就将这个人筛掉,于是银行便损失掉这个客户。但客户是需要银行花成本营销过来的。如果有了这个数据,便可以节约对该客户的营销成本。这些数据的价格可以根据其应用价值和节约成本测算出来。
有了产品,也有了定价,具体怎么卖?据介绍,目前大数据交易方式主要有在线、离线和托管3种。在线的方式类似于网上购物,买卖双方借助交易平台达成交易;离线的方式适用于大型的历史性数据,这类数据不适宜在线传送,所以一般采取线下一次性交割的方式;托管的方式就是数据提供方将数据交由交易平台管理,一旦有用户请求购买,交易平台可以直接完成数据的配送。
除了这些常规方式,秦翯所在的公司还想出了拍卖的方式。秦翯解释说,一些新兴企业破产后,没有很多的固定资产,其最大的资产便是数据。我们很快要成立数据资产评估中心,一旦这些企业在我们的评估中心登记了资产,我们会为其提供破产清算,把他们的数据资产放到平台上进行拍卖,再由需求者竞价购置。
(3)交易要有规则不得侵犯隐私
将“数据”与“交易”这两个词放在一起,很多人首先联想到的恐怕就是诈骗电话、恶性推销等社会乱象。因此,大数据交易最不能回避的就是隐私问题。
在秦翯看来,乱象产生的根源不在交易而在规则。“在大数据交易平台正式搭建之前,数据信息被私下交易的情况便已十分普遍。根据我们日常生活的经验,诈骗电话及恶性广告推销等行为都是不良数据交易引发的信息泄露所带来的恶果。然而这些弊端的产生并不是由于数据交易本身造成的,而是由交易规则体系不完善造成的。”秦翯说。
段莹表示,如果不想造成侵犯,在交易之前,数据供需双方就必须要明确什么样的数据可以进行交易,什么样的不可以。目前问题在于中国没有隐私法,很多数据是否涉及隐私很难界定。
国外是否有经验可循?秦翯介绍说,美国很早就从国家层面形成了强有力的有关数据资产的法律体系。有的国家已经处在探讨数据资产化的阶段,比如法国出台数字经济纳税条例,对享有公民免费数据的互联网企业增加一些税种。
由于没有全面覆盖的法律,秦翯所在的公司便临时制定了一个规则,试图规避一些在数据交易过程中潜在的风险。“我们将在今年4月底发布全国第一个中关村数据资产评估中心,该中心将赋予数据20多项权益,突破此前单纯的物产概念,将数据纳入知识产权、虚拟财产权(资本利得权)和财产权(物权)三位一体的数据权益体系,多维度区分不同形态和层级,建立新时代背景下的大数据产权制度,帮助数据交易畅通无阻地进行。”秦翯说。
当然,有些简单的方式也可以解决隐私问题,那就是选择适当的大数据交易品种。借用之前的比喻,如果我们直接出售土豆,卖家或许可以判断出品种、产地等“土豆隐私”,而如果我们将土豆做成薯条出卖,这些隐私就不会泄露出去了。“我们不是交易底层数据,而是交易数据分析的结果。”贵阳大数据交易所总裁王叁寿表示,前者系信息泄露,属于违法行为;而后者则可以在合法范围内为客户提供建模分析,用以指导其部署决策、制定营销计划和战略规划等。
此外,贵阳大数据交易所实现会员制,严格控制交易所的会员准入制度,申请加入交易所的会员必须接受严格的资质及信誉审查,保证了数据的质量及数据不被滥用。
(4)中国大数据前景在传统产业
“贵阳大数据交易所能让中国诞生一个上万亿产值的新产业,大数据交易所作为其中的推动者、引领者,带动整个中国大数据产业的发展。”王叁寿表示,中国乃至全球都在思考数据的价值。
作为大数据交易行业的先行者,秦翯认为中国的数据交易在未来必会走出一条与国外不同的发展道路。据秦翯介绍,国外很早就有政府数据开放平台和数据交易平台,只是最终都已转型。这其中的原因比较复杂。以美国为例,提供数据交易的公司很多,美国有比较强大的征信体系,而征信公司本身就是一个巨大的数据融合平台,可以对居民衣食住行等各个方面的数据加以整合并对其进行综合评价。秦翯认为,“就整体而言,国内数据开放的渠道还不够通畅,即便有区域性的数据开放也没能形成有效的融合,因而存在割裂化和碎片化的问题。但这些都是大数据交易在发展过程中呈现出的阶段性特征,需要逐步去解决。”
“基于我国国情,大数据交易在寻求高效有序发展路径时,必须要依托政府和市场的双重力量。在大数据交易方面发展较快的互联网金融以及电子商务行业,应发挥自身的先导作用,通过搭建数据交易平台等方式积极与政府进行合作,助力政府数据资源的开放和共享。同时,政府也应鼓励和支持企业在大数据交易领域所做的积极尝试。”秦翯说。
朱奔也有着相同的看法:“如果没有市场竞争机制的刺激,政府数据开放的过程也将被大大延长;反之,如果没有政府的引导,只靠市场行为是很难推动全社会数据开放及数据共享的。”
大数据起源于互联网与电子商务,因此,这些领域率先进行了大数据交易;但是,业内人士指出,随着大数据交易在整个社会的不断推进,医疗、交通、钢铁等产业会成为未来最大的亮点。
“大数据交易最大的应用前景在传统产业。这不仅是由于几乎所有传统产业都在互联网化,更是因为传统产业仍然占据了国内生产总值的绝大部分份额。大数据交易会帮助这些传统产业更快地完成转型升级,进而通过大数据的融合的调度推动智慧城市的建设。”
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15在企业数字化转型、系统架构设计、数据治理与AI落地过程中,数据模型、本体模型、业务模型是三大核心基础模型,三者相互支撑、各 ...
2026-04-15数据分析师的一天,80%的时间花在表格数据上,但80%的坑也踩在表格数据上。 如果你分不清数值型和文本型的区别,不知道数据从哪 ...
2026-04-15在人工智能与机器学习落地过程中,模型质量直接决定了应用效果的优劣——无论是分类、回归、生成式模型,还是推荐、预测类模型, ...
2026-04-14在Python网络编程、接口测试、爬虫开发等场景中,HTTP请求的发送与响应处理是核心需求。Requests库作为Python生态中最流行的HTTP ...
2026-04-14 很多新人学完Python、SQL,拿到一张Excel表还是不知从何下手。 其实,90%的商业分析问题,都藏在表格的结构里。 ” 引言:为 ...
2026-04-14在回归分析中,因子(即自变量)的筛选是构建高效、可靠回归模型的核心步骤——实际分析场景中,往往存在多个候选因子,其中部分 ...
2026-04-13在机器学习模型开发过程中,过拟合是制约模型泛化能力的核心痛点——模型过度学习训练数据中的噪声与偶然细节,导致在训练集上表 ...
2026-04-13在数据驱动商业升级的今天,商业数据分析已成为企业精细化运营、科学决策的核心手段,而一套规范、高效的商业数据分析总体流程, ...
2026-04-13主讲人简介 张冲,海归统计学硕士,CDA 认证数据分析师,前云南白药集团资深数据分析师,自媒体 Python 讲师,全网课程播放量破 ...
2026-04-13在数据可视化与业务分析中,同比分析是衡量业务发展趋势、识别周期波动的核心手段,其核心逻辑是将当前周期数据与上年同期数据进 ...
2026-04-13在机器学习模型的落地应用中,预测精度并非衡量模型可靠性的唯一标准,不确定性分析同样不可或缺。尤其是在医疗诊断、自动驾驶、 ...
2026-04-10数据本身是沉默的,唯有通过有效的呈现方式,才能让其背后的规律、趋势与价值被看见、被理解、被运用。统计制图(数据可视化)作 ...
2026-04-10在全球化深度发展的今天,跨文化传播已成为连接不同文明、促进多元共生的核心纽带,其研究核心围绕“信息传递、文化解读、意义建 ...
2026-04-09