京公网安备 11010802034615号
经营许可证编号:京B2-20210330
脱离互联网与云计算去讲数据是个大误区
做大数据以前,对企业的影响可能还要追溯到互联网对企业的影响。要讲清,让大家理解大数据对企业的理解,有三件事情可能少不了:
一个就是互联网。互联网很热门的词就是云计算,就是大数据。原因非常简单,互联网公司一定是一家数据公司。阿里巴巴在2008年的时候开过一次会,突然发现不是电子商务公司,是数据公司,对公司非常非常大的影响。
第二个事情对企业有非常大的影响,当自己发现是数据公司,突然发现少了一个东西,少了把数据变成财富的东西,靠什么呢?就是靠云计算,必须用最低的成本从数据里面得到价值,才能活下去,所以大家设想一下,如果不能用最低的成本得到价值,是活不下去的,这是最基本的。
第三个明白了事情就是计算一定要变成公共服务,2008年开始,对我们企业来讲,用另外的角度来表达阿里巴巴,我们曾经讲过几句话,不上淘宝的人可能不太有,淘宝对中国社会最大的贡献不是让大家上去买东西,对社会最大的贡献是消费者的习惯在我们自己企业手里。消费者的习惯就是数据,这是倒过来看的。有时马云也会讲,公司是拿数据去卖东西的,阿里巴巴这家公司是卖东西,是为了数据,这是一个最基本的不一样的地方,也是我们慢慢慢慢过来的。
阿里巴巴做的小额贷款的事情,最体现了数据的价值,或者互联网数据,我先不说大数据,互联网数据的价值,过去要说贷款的话,银行最重要的是调查信用,要抵押,就这两个事。调查信用是传统的来看数据的方法,也可以讲这是数据,但是传统的,为什么它?它跟互联网无关。我们怎么用数据来变成一个企业的信用呢?用过去它在我们平台上沉淀下来的数据,不是我们去收集的数据,是沉淀下来的数据,这些数据过去是没有用的,但是因为我们把它变成模型,变成信用以后,就变成这家小企业的财富,才会使我们由300多个员工给70万人做贷款,这是数据的效用跟价值。
倒过来,对我们的组织结构的冲击是很大的,过去用这样的方法做事情,今天会想用另外的方法做事情,对我们的组织结构的冲击也是很大的。
我想表达的意思是什么呢?如果你今天讲数据的话,千万不要觉得大数据是从数据变成大数据的,不是这样的,其实今天实际上是一个把过去从所谓的信息社会变成了数据社会,可能这样讲更好一点。这句话是什么意思呢?过去因为没有互联网,因为没有计算能力,所以你能够得到的数据一定要大家觉得马上很有价值的东西,大家过去称之信息。
今天是因为有了互联网巨大的计算能力以后,今天你是可以得到很多数据,而不追求今天的数据价值,但是它在第二天可以带来更大的价值。从第一天起大家都知道数据,它是从信息到数据的转变,因为有了互联网,有了计算能力,大家可以设想一下第一天会要求拿到的是最有用的信息,但是过了两天发现,今天看起来没有用的东西变成了最有用的东西,谷歌是做的最好的例子,让一个点击,鼠标点一点可以挣几千美金,鼠标这个东西,在微软时代,多少人点鼠标没有人把它变成财富,但是互联网时代把它变成了财富。这是非常典型的例子,只收集信息,今天看来不会变成你的财富了,而去年得到看起来没有价值的东西可以变成财富,这是阿里巴巴自己很重要的理解。
今天我们对数据的理解,尽管有很多消费者喜欢,但是还很粗浅。我曾经跟马总讲的话,对我们自己公司反省,阿里巴巴对数据的理解还是非常原始的,另外一个角度讲,阿里巴巴对数据的理解不会超过苏宁对电子商务的理解。应该尊重苏宁集团,但苏宁对电子商务的理解的确不够。
讲这句话的意思是,大家对这件事情的认识还是很浅,我们对数据很尊敬,只是想表达一下我们在非常原始的状态,在这个行业,今天刚刚开始,严格上讲也没有专家,大家碰到的都是新问题,但是挑战不要低估了,走出两个误区,一个是觉得把过去的数据,过去谈数据,今天再谈大一点,把方法再搬过来。第二,脱离了互联网跟云计算讲数据,也是蛮大的误区。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析师的日常,常始于一堆“毫无章法”的数据点:电商后台导出的零散订单记录、APP埋点收集的无序用户行为日志、传感器实时 ...
2025-11-28在MySQL数据库运维中,“query end”是查询执行生命周期的收尾阶段,理论上耗时极短——主要完成结果集封装、资源释放、事务状态 ...
2025-11-28在CDA(Certified Data Analyst)数据分析师的工具包中,透视分析方法是处理表结构数据的“瑞士军刀”——无需复杂代码,仅通过 ...
2025-11-28在统计分析中,数据的分布形态是决定“用什么方法分析、信什么结果”的底层逻辑——它如同数据的“性格”,直接影响着描述统计的 ...
2025-11-27在电商订单查询、用户信息导出等业务场景中,技术人员常面临一个选择:是一次性查询500条数据,还是分5次每次查询100条?这个问 ...
2025-11-27对数据分析从业者和学生而言,表结构数据是最基础也最核心的分析载体——CRM系统的用户表、门店的销售明细表、仓库的库存表,都 ...
2025-11-27在业务数据可视化中,热力图(Heat Map)是传递“数据密度与分布特征”的核心工具——它通过颜色深浅直观呈现数据值的高低,让“ ...
2025-11-26在企业数字化转型中,业务数据分析师是连接数据与决策的核心纽带。但“数据分析师”并非单一角色,从初级到高级,其职责边界、能 ...
2025-11-26表格结构数据以“行存样本、列储属性”的规范形态,成为CDA数据分析师最核心的工作载体。从零售门店的销售明细表到电商平台的用 ...
2025-11-26在pandas数据处理工作流中,“列标签”(Column Labels)是连接数据与操作的核心桥梁——它不仅是DataFrame数据结构的“索引标识 ...
2025-11-25Anaconda作为数据科学领域的“瑞士军刀”,集成了Python解释器、conda包管理工具及海量科学计算库,是科研人员、开发者的必备工 ...
2025-11-25在CDA(Certified Data Analyst)数据分析师的日常工作中,表格结构数据是最常接触的“数据形态”——从CRM系统导出的用户信息表 ...
2025-11-25在大数据营销从“粗放投放”向“精准运营”转型的过程中,企业常面临“数据维度繁杂,核心影响因素模糊”的困境——动辄上百个用 ...
2025-11-24当流量红利逐渐消退,“精准触达、高效转化、长效留存”成为企业营销的核心命题。大数据技术的突破,让营销从“广撒网”的粗放模 ...
2025-11-24在商业数据分析的全链路中,报告呈现是CDA(Certified Data Analyst)数据分析师传递价值的“最后一公里”,也是最容易被忽视的 ...
2025-11-24在数据可视化实践中,数据系列与数据标签的混淆是导致图表失效的高频问题——将数据标签的样式调整等同于数据系列的维度优化,或 ...
2025-11-21在数据可视化领域,“静态报表无法展现数据的时间变化与维度关联”是长期痛点——当业务人员需要分析“不同年份的区域销售趋势” ...
2025-11-21在企业战略决策的场景中,“PESTEL分析”“波特五力模型”等经典方法常被提及,但很多时候却陷入“定性描述多、数据支撑少”的困 ...
2025-11-21在企业数字化转型过程中,“业务模型”与“数据模型”常被同时提及,却也频繁被混淆——业务团队口中的“用户增长模型”聚焦“如 ...
2025-11-20在游戏行业“高获客成本、低留存率”的痛点下,“提前预测用户流失并精准召回”成为运营核心命题。而用户流失并非突发行为——从 ...
2025-11-20