京公网安备 11010802034615号
经营许可证编号:京B2-20210330
大数据开放趋于审慎:危机,商机_数据分析师考试
两天前,马云在阿里牵手SMG旗下一财的时候,提到了阿里平台数据开放未来会审慎,只会开放给战略合作伙伴。马云提到了安全,当天我也主要从安全角度做了一点点分析。今天尝试从另一角度来看这言论背后隐含的产业趋势。
我觉得,它很可能与日益明显的数据资产化动向深有关联。
你知道,过去几个月,马云多次将大数据与石油相提并论,观点其实也不新。世界经济论坛报告较早时就这么说,未来的大数据将成为“新的财富高地”,价值可能堪比石油;彭博创始人布隆伯格在他的书里也明确提过,大数据就是未来重要的资产;大数据研究专家维克托不知是抄袭还是变通地说,未来,大数据会列入企业资产负债表。
大数据有价值毋庸置疑。这是定性问题。但这价值主要是使用价值,就是说我们具体用它的时候,感到了牛逼。但若要你说它价值几何,如何定量、量化、定价并不清楚。它还缺乏很明确的资产属性。
截至目前,全球也没有一种标准体系,能评定某个领域一定容量、一定周期的数据具体价值。但我相信,这个工作一定正在有人做。尤其是中国,考虑到我们的线下生态如此复杂,反而是全球大数据的高地,这个工作应该更是紧迫。
在这个缺乏量化的阶段,想想看,如果阿里这类以大数据为核心竞争力的互联网公司,毫无节制地继续开放,会发生什么。
阿里的数据基本都是结构化数据,不用清洗,不用另外建模,就能直交易,因为它本身就是交易的结果,并且接近资金流,买方诉求、意图非常直白。就是说,阿里大数据直接输出,确实会有明显增值,能撬动市场,创造平台收益,促进自身生态变得更为强大。
但阿里这种大数据的加工与输出,仍属于比较原始、粗放、单一的形态。因为它基于阿里平台特点形成,与阿里商业模式紧密关联,融为一体。阿里不是独立的第三方大数据分析、挖掘的公司。我说的独立,当然是跨平台、具有全网覆盖特征的一类。这就决定了阿里的大数据运营未必像市场上小型的专业公司那么灵活,能将大数据用各种方式变通输出。
在数据还没有真正被灌注资产属性、成为真正意义上的“资产”前,阿里的这种大数据开放,其实隐含着价值稀释风险。它的数据很容易被第三方获取,重新利用、挖掘,形成更多增值的部分。现在还看不出,因为行业还刚刚开始,一旦形成潮流,阿里大数据服务如果还维持这种途径,它的核心竞争力会进一步被稀释、解构,为人做嫁衣。严格来说,如果不加控制,过于开放的阿里,在数据方面很容易被人OTT。
市场上已经有许多小型的独立的大数据分析公司,大都带有爬虫特征,除了自动原始积累,它们还又偷又拿。
马云从安全角度提到这个问题。我们理解的安全,除了更大层面的比如国民经济安全,公司商业秘密、个人金融信息以及个人隐私外,也包括开放的商业竞争层面。
不光是阿里,我相信整个互联网行业意识到数据资产化的未来,都不太可能像过去完全开放。
还有一个大事件,应该算是一个提醒。一个多月前,贵州贵阳成立了中国第一个大数据交易所,应该也是全球第一个直接命名的大数据交易所。
这新闻好像被行业给忽视了,至少没有传递出它隐含的更多价值。这个意味着,大数据的资产化开始具有更加开放的交易平台,一定会加速推动我上面说的定量进程。
但是,若你看到这个交易所背后的股东,会感受到,它对阿里甚至BAT乃至全球大数据的核心玩家,都会有一定的冲击。从生态角度看,阿里只是它们平台上的一个交易方、一块土壤而已。
贵阳大数据交易所注册资本5000万元。背后股东包括:代表贵阳市国资委的贵州阳光产权交易所(51%)、九次方大数据公司(15%)、北京亚信数据有限公司(15%)、郑州市迅捷贸易有限公司(10%)、贵阳移动金融发展有限公司(9%)。
你看到了九次方、亚信。它们都是市场上独立的大数据服务公司。尤其是九次方,创始人王叁寿,年龄不大,80后,在这个领域有比较高的名气。亚信不用说了,老牌的IT服务企业,在数据领域耕耘多年;郑州迅捷贸易,背后就是富士康,你应该明白贵阳“数博会”上,为什么感觉搭不上的郭台铭也出现在现场,并且能站在国务院副总理马凯旁边,跟马云、马化腾等人一道光鲜。
你能看到,贵阳这个大数据交易所股东还有贵阳移动金融,它其实是一家互联网模式的金融配套企业,未来一定能丰富这个交易所的模式。
这个交易所的产品覆盖了医疗大数据、金融大数据、企业大数据、电商大数据、能源大数据、交通大数据、商品大数据、消费大数据、教育大数据、社交大数据、社会大数据等,几乎覆盖了所能覆盖的关键领域。
它不仅撮合数据交易,而且还尝试建立一种完整的行业标准与游戏规则,比如数据清洗、数据定价、建模分析、平台开发、技术服务、数据交易、数据确认、交易监督、数据金融等。
你能体会到股东里为什么没有BAT、京东、苏宁易购们这类企业?这与它们的定位有关。阿里们更像是数据生产商。它们虽然也有自己的输出体系,但毕竟不是第三方的开放平台。理论上,它们都只不过是贵阳大数据交易所平台上的一个交易者。
这当然更给阿里们创造大数据的交易机会,提供变现通道。但另一面,它一定会冲击阿里们自身在大数据领域的开放度。这里有一个类似直营渠道与外部第三方渠道的问题。
我不相信阿里心里没有权衡过它与贵阳大数据交易所这类平台的未来关系。我相信它早就考虑到更远的未来。因为,随着阿里云输入,阿里平台的商业化越来越强,触达越来越广,除了蚂蚁金服已经独立,成为金融大数据的重磅玩家,阿里电商平台也正在加速走出实物电商概念,走向更广阔的几乎可以覆盖整个国民经济的大数据市场。
那时,阿里的大数据就不像今天一样侧重呈现结构化特征,一定会是非结构的居多。
类似贵阳大数据交易所,它对阿里的冲击,未来会集中在以技术为核心的平台服务上,这个部分具有很高的增值能力。未来,贵阳大数据交易所未来会用技术手段,对接买方需求,用尽各种模式兜售大数据,它不会是一个简单的撮合平台。
贵阳大数据交易所毕竟还只是一个机构。未来,我相信,会出现更多开放的交易平台。它们会汇聚大量中小型数据生产商,从而对阿里这类大型数据平台构成挑战。
在大数据商业环境不成熟、缺乏立法保障、安全隐患多多、数据尚未被真正灌注资产属性、新的更为丰富的大数据运营模式诞生之前,阿里们的大数据输出应该会趋于谨慎。
马云说,未来只会选择战略性合作伙伴进行输出。你体会他的口气,其实很大程度上等于封闭。如此,阿里的大数据除了能保证他说的安全之外,还能保证未来的溢价。
阿里的这一动向,可能会影响到它的未来部分运营。
你知道阿里与京东的模式有差异,一个渲染开放,一个渲染自营,但在阿里与贵阳大数据交易所以及未来更多开放的数据交易平台之间,阿里却像是自营的模式。这不但会影响到它的商业模式,也会影响它与真正产生大数据的商户之间的关系。阿里如果不能形成良好的运营机制,围绕大数据资产建立合理的利益分享模式,它的平台商户,就会面临分化、分流,这一风险,比当前阿里平台商户外流要更大,也更深。
“大数据时代”其实是个动态的概念,它永远不可能出现一个非常稳定、理想的图景。这个阶段,谁能够提前预判到未来,与政府、传统行业、企业建立更深的关联,能渗透国计民生,并在大数据技术、后台建立门槛,它就最有可能成为未来的王者,也会是事实上的标准统治者。
阿里大数据开放趋于谨慎,可以视为中国企业在大数据领域的一次意识自觉,安全固然是一大风险,但我更认为,这是互联网+开幕时代,整个互联网行业从过度开放、泛滥无节制走向审慎、节制的信号。它事关一个行业的伦理规范、核心竞争力重构,当然也事关一个国家在全球的竞争力构建。
当然,未来的竞争肯定会更多落在商业层面。它一定会很激烈,考虑到线下资源、生态丰富度,我相信,全球性巨头一定会诞生在本地,它未必是阿里,但它一定会烙上深深的中国印记。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在神经网络模型搭建中,“最后一层是否添加激活函数”是新手常困惑的关键问题——有人照搬中间层的ReLU激活,导致回归任务输出异 ...
2025-12-05在机器学习落地过程中,“模型准确率高但不可解释”“面对数据噪声就失效”是两大核心痛点——金融风控模型若无法解释决策依据, ...
2025-12-05在CDA(Certified Data Analyst)数据分析师的能力模型中,“指标计算”是基础技能,而“指标体系搭建”则是区分新手与资深分析 ...
2025-12-05在回归分析的结果解读中,R方(决定系数)是衡量模型拟合效果的核心指标——它代表因变量的变异中能被自变量解释的比例,取值通 ...
2025-12-04在城市规划、物流配送、文旅分析等场景中,经纬度热力图是解读空间数据的核心工具——它能将零散的GPS坐标(如外卖订单地址、景 ...
2025-12-04在CDA(Certified Data Analyst)数据分析师的指标体系中,“通用指标”与“场景指标”并非相互割裂的两个部分,而是支撑业务分 ...
2025-12-04每到“双十一”,电商平台的销售额会迎来爆发式增长;每逢冬季,北方的天然气消耗量会显著上升;每月的10号左右,工资发放会带动 ...
2025-12-03随着数字化转型的深入,企业面临的数据量呈指数级增长——电商的用户行为日志、物联网的传感器数据、社交平台的图文视频等,这些 ...
2025-12-03在CDA(Certified Data Analyst)数据分析师的工作体系中,“指标”是贯穿始终的核心载体——从“销售额环比增长15%”的业务结论 ...
2025-12-03在神经网络训练中,损失函数的数值变化常被视为模型训练效果的“核心仪表盘”——初学者盯着屏幕上不断下降的损失值满心欢喜,却 ...
2025-12-02在CDA(Certified Data Analyst)数据分析师的日常工作中,“用部分数据推断整体情况”是高频需求——从10万条订单样本中判断全 ...
2025-12-02在数据预处理的纲量统一环节,标准化是消除量纲影响的核心手段——它将不同量级的特征(如“用户年龄”“消费金额”)转化为同一 ...
2025-12-02在数据驱动决策成为企业核心竞争力的今天,A/B测试已从“可选优化工具”升级为“必选验证体系”。它通过控制变量法构建“平行实 ...
2025-12-01在时间序列预测任务中,LSTM(长短期记忆网络)凭借对时序依赖关系的捕捉能力成为主流模型。但很多开发者在实操中会遇到困惑:用 ...
2025-12-01引言:数据时代的“透视镜”与“掘金者” 在数字经济浪潮下,数据已成为企业决策的核心资产,而CDA数据分析师正是挖掘数据价值的 ...
2025-12-01数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27