京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据开放趋于审慎:危机,商机_数据分析师考试
两天前,马云在阿里牵手SMG旗下一财的时候,提到了阿里平台数据开放未来会审慎,只会开放给战略合作伙伴。马云提到了安全,当天我也主要从安全角度做了一点点分析。今天尝试从另一角度来看这言论背后隐含的产业趋势。
我觉得,它很可能与日益明显的数据资产化动向深有关联。
你知道,过去几个月,马云多次将大数据与石油相提并论,观点其实也不新。世界经济论坛报告较早时就这么说,未来的大数据将成为“新的财富高地”,价值可能堪比石油;彭博创始人布隆伯格在他的书里也明确提过,大数据就是未来重要的资产;大数据研究专家维克托不知是抄袭还是变通地说,未来,大数据会列入企业资产负债表。
大数据有价值毋庸置疑。这是定性问题。但这价值主要是使用价值,就是说我们具体用它的时候,感到了牛逼。但若要你说它价值几何,如何定量、量化、定价并不清楚。它还缺乏很明确的资产属性。
截至目前,全球也没有一种标准体系,能评定某个领域一定容量、一定周期的数据具体价值。但我相信,这个工作一定正在有人做。尤其是中国,考虑到我们的线下生态如此复杂,反而是全球大数据的高地,这个工作应该更是紧迫。
在这个缺乏量化的阶段,想想看,如果阿里这类以大数据为核心竞争力的互联网公司,毫无节制地继续开放,会发生什么。
阿里的数据基本都是结构化数据,不用清洗,不用另外建模,就能直交易,因为它本身就是交易的结果,并且接近资金流,买方诉求、意图非常直白。就是说,阿里大数据直接输出,确实会有明显增值,能撬动市场,创造平台收益,促进自身生态变得更为强大。
但阿里这种大数据的加工与输出,仍属于比较原始、粗放、单一的形态。因为它基于阿里平台特点形成,与阿里商业模式紧密关联,融为一体。阿里不是独立的第三方大数据分析、挖掘的公司。我说的独立,当然是跨平台、具有全网覆盖特征的一类。这就决定了阿里的大数据运营未必像市场上小型的专业公司那么灵活,能将大数据用各种方式变通输出。
在数据还没有真正被灌注资产属性、成为真正意义上的“资产”前,阿里的这种大数据开放,其实隐含着价值稀释风险。它的数据很容易被第三方获取,重新利用、挖掘,形成更多增值的部分。现在还看不出,因为行业还刚刚开始,一旦形成潮流,阿里大数据服务如果还维持这种途径,它的核心竞争力会进一步被稀释、解构,为人做嫁衣。严格来说,如果不加控制,过于开放的阿里,在数据方面很容易被人OTT。
市场上已经有许多小型的独立的大数据分析公司,大都带有爬虫特征,除了自动原始积累,它们还又偷又拿。
马云从安全角度提到这个问题。我们理解的安全,除了更大层面的比如国民经济安全,公司商业秘密、个人金融信息以及个人隐私外,也包括开放的商业竞争层面。
不光是阿里,我相信整个互联网行业意识到数据资产化的未来,都不太可能像过去完全开放。
还有一个大事件,应该算是一个提醒。一个多月前,贵州贵阳成立了中国第一个大数据交易所,应该也是全球第一个直接命名的大数据交易所。
这新闻好像被行业给忽视了,至少没有传递出它隐含的更多价值。这个意味着,大数据的资产化开始具有更加开放的交易平台,一定会加速推动我上面说的定量进程。
但是,若你看到这个交易所背后的股东,会感受到,它对阿里甚至BAT乃至全球大数据的核心玩家,都会有一定的冲击。从生态角度看,阿里只是它们平台上的一个交易方、一块土壤而已。
贵阳大数据交易所注册资本5000万元。背后股东包括:代表贵阳市国资委的贵州阳光产权交易所(51%)、九次方大数据公司(15%)、北京亚信数据有限公司(15%)、郑州市迅捷贸易有限公司(10%)、贵阳移动金融发展有限公司(9%)。
你看到了九次方、亚信。它们都是市场上独立的大数据服务公司。尤其是九次方,创始人王叁寿,年龄不大,80后,在这个领域有比较高的名气。亚信不用说了,老牌的IT服务企业,在数据领域耕耘多年;郑州迅捷贸易,背后就是富士康,你应该明白贵阳“数博会”上,为什么感觉搭不上的郭台铭也出现在现场,并且能站在国务院副总理马凯旁边,跟马云、马化腾等人一道光鲜。
你能看到,贵阳这个大数据交易所股东还有贵阳移动金融,它其实是一家互联网模式的金融配套企业,未来一定能丰富这个交易所的模式。
这个交易所的产品覆盖了医疗大数据、金融大数据、企业大数据、电商大数据、能源大数据、交通大数据、商品大数据、消费大数据、教育大数据、社交大数据、社会大数据等,几乎覆盖了所能覆盖的关键领域。
它不仅撮合数据交易,而且还尝试建立一种完整的行业标准与游戏规则,比如数据清洗、数据定价、建模分析、平台开发、技术服务、数据交易、数据确认、交易监督、数据金融等。
你能体会到股东里为什么没有BAT、京东、苏宁易购们这类企业?这与它们的定位有关。阿里们更像是数据生产商。它们虽然也有自己的输出体系,但毕竟不是第三方的开放平台。理论上,它们都只不过是贵阳大数据交易所平台上的一个交易者。
这当然更给阿里们创造大数据的交易机会,提供变现通道。但另一面,它一定会冲击阿里们自身在大数据领域的开放度。这里有一个类似直营渠道与外部第三方渠道的问题。
我不相信阿里心里没有权衡过它与贵阳大数据交易所这类平台的未来关系。我相信它早就考虑到更远的未来。因为,随着阿里云输入,阿里平台的商业化越来越强,触达越来越广,除了蚂蚁金服已经独立,成为金融大数据的重磅玩家,阿里电商平台也正在加速走出实物电商概念,走向更广阔的几乎可以覆盖整个国民经济的大数据市场。
那时,阿里的大数据就不像今天一样侧重呈现结构化特征,一定会是非结构的居多。
类似贵阳大数据交易所,它对阿里的冲击,未来会集中在以技术为核心的平台服务上,这个部分具有很高的增值能力。未来,贵阳大数据交易所未来会用技术手段,对接买方需求,用尽各种模式兜售大数据,它不会是一个简单的撮合平台。
贵阳大数据交易所毕竟还只是一个机构。未来,我相信,会出现更多开放的交易平台。它们会汇聚大量中小型数据生产商,从而对阿里这类大型数据平台构成挑战。
在大数据商业环境不成熟、缺乏立法保障、安全隐患多多、数据尚未被真正灌注资产属性、新的更为丰富的大数据运营模式诞生之前,阿里们的大数据输出应该会趋于谨慎。
马云说,未来只会选择战略性合作伙伴进行输出。你体会他的口气,其实很大程度上等于封闭。如此,阿里的大数据除了能保证他说的安全之外,还能保证未来的溢价。
阿里的这一动向,可能会影响到它的未来部分运营。
你知道阿里与京东的模式有差异,一个渲染开放,一个渲染自营,但在阿里与贵阳大数据交易所以及未来更多开放的数据交易平台之间,阿里却像是自营的模式。这不但会影响到它的商业模式,也会影响它与真正产生大数据的商户之间的关系。阿里如果不能形成良好的运营机制,围绕大数据资产建立合理的利益分享模式,它的平台商户,就会面临分化、分流,这一风险,比当前阿里平台商户外流要更大,也更深。
“大数据时代”其实是个动态的概念,它永远不可能出现一个非常稳定、理想的图景。这个阶段,谁能够提前预判到未来,与政府、传统行业、企业建立更深的关联,能渗透国计民生,并在大数据技术、后台建立门槛,它就最有可能成为未来的王者,也会是事实上的标准统治者。
阿里大数据开放趋于谨慎,可以视为中国企业在大数据领域的一次意识自觉,安全固然是一大风险,但我更认为,这是互联网+开幕时代,整个互联网行业从过度开放、泛滥无节制走向审慎、节制的信号。它事关一个行业的伦理规范、核心竞争力重构,当然也事关一个国家在全球的竞争力构建。
当然,未来的竞争肯定会更多落在商业层面。它一定会很激烈,考虑到线下资源、生态丰富度,我相信,全球性巨头一定会诞生在本地,它未必是阿里,但它一定会烙上深深的中国印记。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23近日,由 CDA 数据科学研究院重磅发布的《2026 全球数智化人才指数报告》,被中国教育科学研究院官方账号正式收录, ...
2026-04-22在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22 很多数据分析师每天盯着GMV、转化率、DAU等数字看,但当被问到“什么是指标”“指标和维度有什么区别”“如何搭建一套完整的 ...
2026-04-22在数据分析与业务决策中,数据并非静止不变的数值,而是始终处于动态波动之中——股市收盘价的每日涨跌、企业月度销售额的起伏、 ...
2026-04-21在数据分析领域,当研究涉及多个自变量与多个因变量之间的复杂关联时,多变量一般线性分析(Multivariate General Linear Analys ...
2026-04-21很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度”“这 ...
2026-04-21在数据处理与分析的全流程中,日期数据是贯穿业务场景的核心维度之一——无论是业务报表统计、用户行为追踪,还是风控规则落地、 ...
2026-04-20在机器学习建模全流程中,特征工程是连接原始数据与模型效果的关键环节,而特征重要性分析则是特征工程的“灵魂”——它不仅能帮 ...
2026-04-20很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问题, ...
2026-04-20在数字化时代,数据已成为企业决策的核心驱动力,数据分析与数据挖掘作为解锁数据价值的关键手段,广泛应用于互联网、金融、医疗 ...
2026-04-17在数据处理、后端开发、报表生成与自动化脚本中,将 SQL 查询结果转换为字符串是一项高频且实用的操作。无论是拼接多行数据为逗 ...
2026-04-17面对一份上万行的销售明细表,要快速回答“哪个地区卖得最好”“哪款产品增长最快”“不同客户类型的购买力如何”——这些看似复 ...
2026-04-17数据分析师一天的工作,80% 的时间围绕表格结构数据展开。从一张销售明细表到一份完整的分析报告,表格结构数据贯穿始终。但你真 ...
2026-04-16在机器学习无监督学习领域,Kmeans聚类因其原理简洁、计算高效、可扩展性强的优势,成为数据聚类任务中的主流算法,广泛应用于用 ...
2026-04-16在机器学习建模实践中,特征工程是决定模型性能的核心环节之一。面对高维数据集,冗余特征、无关特征不仅会增加模型训练成本、延 ...
2026-04-16在数字化时代,用户是产品的核心资产,用户运营的本质的是通过科学的指标监测、分析与优化,实现“拉新、促活、留存、转化、复购 ...
2026-04-15