京公网安备 11010802034615号
经营许可证编号:京B2-20210330
脱掉大数据外衣 走出大数据困境 _数据分析师
如果要评选最近两年出现在媒体上的十大热词,大数据毫无意外会入选其中。
然而,似乎所有人都意识到大数据的能力,但却找不到运用大数据的方法。不管是企业、政府或者其他社团组织,大数据离他们那么近,却那么远。
大数据成了人们竞相议论的热词,但鲜有人提及这场巨大变革中人们需要具备的能力,无数的企业及个人忘‘数’兴叹。
作为阿里巴巴集团商业智能部副总裁、国内大数据实践的先行者和数据观察家,拥有十几年丰富的数据实战经验的车品觉,或许是国内对于如何利用大数据这个问题最有话语权的那个人。
未来是大数据的时代,未来的竞争就是数据的竞争,也许,我们早该忘掉那些华而不实的喧嚣,让大数据真正从‘看’到‘用’,真正地活起来。
为了能让更多的人学会怎么用大数据,车品觉写作了《决战大数据》一书。在该书中,他试图呈现出自己所理解的大数据的本质以及如何才能让企业走出用大数据的困境。
作为一个跟数据打了十几年交道的人,我深深地知道,从‘看’到‘用’,再从‘用’到‘养’运营数据,本身就是一个复杂的过程。目前我们最应该做的,就是暂且忘记大数据的概念。
我希望从一个实用的角度来拨开大数据的‘迷雾’,告诉每个人大数据的具体运作应该是什么样的;我们要的不是数据的量,而是有‘质’的量,这正是我写作本书的重要目的。
脱掉大数据外衣
研究、实践大数据多年的车品觉,对于大数据有着自己独特的看法。在他看来,大数据就像是国王的新衣:每个人都在说着动听的话,却没有人看到那件衣服。
网络上有很多人在谈大数据,但是他们只会谈,不会做。那些所谓的大数据专家,根本就没有做过。
对于为何没有好的办法去做,车品觉《决战大数据》一书称:用数据的人不知道大数据从哪里来,做数据的人不知道大数据如何用。
用的人不敢用,因为大数据的真实性;做的人不知道怎么用,因为大数据的复杂性。这一问题造成的结果就是,数据量变得越来越大,而且越来越无法有效地被使用。
大数据从来不是免费的午餐,伴随着大数据热潮的到来,关于大数据的一些问题也会层出不穷大数据会夹杂着虚假信息;大数据的来源是多种渠道的,偏倚、随机的误差总是存在
除了上述问题,人才的断层,才是大数据所面临的最严重的问题。
现在,收集数据的人并不清楚未来使用数据的人要做什么,这是目前大数据的一大命门。
车品觉解释,在使用大数据时,我们通常的做法是先把数据收集起来,因为这些数据在未来可能有用。不过,未来可能有用就注定会引发一个问题收集数据的人不知道未来使用数据的人要做什么。
这时候,如果你再问收集数据的人如何才能更好地收集数据,那么,数据的使用就会陷入一个死循环。
在书中,车品觉举了搜索感冒药的例子,来佐证自己的这一论断,他写道:比如我在搜索引擎里面发现某个地方搜索感冒药的频率非常高,于是,我就断定这个地方可能出现了流行性感冒。但是,这样是否就是正确地使用大数据呢?
答案是否定的。因此,车品觉说,生产数据的人,并没有给使用者这个数据的人一些参数,而使用者在其使用之后如果效果不好,就会面临损失。而这样的信息不对称,最终受到损害的是那些使用数据的人。
问题就是答案
在车品觉看来,企业如果想要真正用好大数据,需要看清楚大数据能给企业带来怎样的价值,以及它的本质到底是什么。
当回归到这个问题时,如果你自己都没有弄清楚,那么就算给你再多的数据,你也只会手足无措。
那么,大数据究竟能给企业带来怎样的价值呢?大数据的本质又是什么呢?在《决战大数据》一书中,车品觉给出了自己的理解:大数据能让企业合理地分配资源,以及带来更好的用户体验,而大数据的本质则在于还原用户的真实需求。
数据收集实现的是企业资源的合理分配,例如,把推荐系统做得更好,让更多的用户可以有更高的概率找到他们想要的商品,这样就能提高商品的购买率,为企业创造更大的经济效益;数据收集实现的也是顾客体验的提升,例如,便捷的搜索引擎可以使顾客更容易地找到他们所需要的商品,为他们创造更加优质的购物体验。
而关于大数据本质的判断,车品觉则在书中作出了如下论断:数据的本质就是还原,这是收集元数据的关键方法,如果没有这个概念,你就不知道未来你需要什么数据,就更不懂得什么是重要的数据,到最后只会产生越来越多的无从辨别的数据。
在车品觉看来,数据的这一还原功能,就像是一个瞄准器,瞄准消费者的购物行为,并且以数据的形式记录下来。
如何更好地理解用户在各个不同场景下表现出来的不同需求,如何更好地理解数据融合后产生的价值,将是未来商业中每一个企业都必须考虑的问题。
阿里巴巴的秘诀
作为阿里巴巴集团副总裁和数据委员会会长,车品觉是少数几个对阿里巴巴从IT战略转型到DT战略(大数据战略)享有发言权的人之一。在《决战大数据》一书中,他总结了阿里巴巴在践行DT战略中的经验分享给后来者。
当谈到阿里巴巴的数据化运营时,我首先想到的就是‘人’,我们太多的时间都在讨论我们应该做什么,却很少会反过来想如果让数据化运营落地首先要从‘人’做起。
因此,在《决战大数据》一书中,车品觉首先跟读者分享的,便是阿里巴巴数据化运营的内功混、通、晒这三板斧。
所谓的混,是指数据分析师要跟管理业务部门的人打成一片。车品觉认为,作为数据分析师,如果不和业务部门混在一起,就不会知道业务部门在做什么,商业敏感是要靠‘混’出来的,它并不会凭空出现在你的面前。
只有具备商业敏感的数据分析师,才会懂得使用什么数据来驱动公司实现经营目标,现在在公司里,我最不希望看到数据分析师长时间坐在自己的位置上埋头苦干,我更愿意看到他们和业务人员混成一片。
而车品觉所谓的通,则是指企业判断数据是否有价值的一种能力,如果做到了这一点,就做到了通。
坚持带着业务问题来观察数据或者带着数据来观察业务,兼备二者的敏感,就是做到了‘通’,有些人在很短的时间里就能判断出数据是否有价值,就是因为‘混通’了。
但是,想要打通数据,并不容易。在书中,车品觉提出了打通数据的三个关键点:首先是要做好数据安全工作,以保证公司内部不同职位的员工可以查看不同的数据;然后,统一不同部门的数据标准,使公司内部数据有统一的接口,避免混乱;最后,关联不同部门的数据,创造机会让数据的运营可以扩散至部门之外。
在打通数据之后,阿里巴巴所做的便是晒数据。在‘晒’数据层面上,通常是通过数据来回答这几个问题:业务好还是不好;数据如何改变可以让业务更好;如何利用数据帮助业务发现机会,甚至产生出新的商业价值。
混、通、晒这三板斧,是阿里巴巴在实施大数据战略时的核心法宝,车品觉说:它们其实是配合了数据方法论与人的修炼,能做到借事修人,让用数据的人在数据中成长,循序渐进地让每个人成为数据分析师。
当然,这三板斧只是阿里巴巴大数据战略的内核部分。在书中,车品觉还提到了实施大数据战略所需要的外延策略,而要了解大数据的最佳实现方式,无疑是直接阅读他所撰写的《决战大数据》一书。
数据的5大价值
01.识别和串联价值
能够辨别关系和身份的数据是最重要的,这些数据应该是有多少存多少,永远不要放弃。在大数据时代,越能够还原用户真实身份和真实行为的数据,就越能够让企业在大数据竞争中保持战略优势。
02.描述价值
描述业务的数据包括成交额、成交用户数、网站的流量、网站详细页的流量、成交的卖家数等等,我们可以通过数据对业务的描述来观察交易活动是否正常。
03.时间价值
数据的时间价值是大数据运用最直接的体现,通过对时间的分析,能够很好地归纳出一个用户对于一种场景的偏好。
04.预测价值
数据的预测价值分成两个部分,第一是对于某一个单品进行预测,第二是数据对于经营状况的预测,即对公司的整体经营进行预测,并能够用预测的结论指导公司的经营策略。
05.产出数据的价值
从数据的价值来说,很多数据本身并没有特别的含义,但是在几个数据组合在一起或者对部分数据进行整合之后,就产生了新的价值。文章来自:CDA数据分析师培训官网
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】大数据、零售商、消费者、供应链、运营、企业、产品、客户、数据模型、大数据平台、数据开发、系统运维、业务逻 ...
2026-06-26在物流配送、供应链履约、终端供货等业务场景中,送货率是衡量企业履约能力、服务质量、供应链稳定性的核心业务指标,直接关联客 ...
2026-06-26 很多数据分析师精通描述性统计,能熟练计算均值、中位数、标准差,但当被问到“用500个样本如何推断10万用户的真实满意度” ...
2026-06-26在数字化管理与数据化运营体系中,指标是连接原始数据与业务决策的核心载体。零散的原始数据只是无意义的数值堆砌,无法直接反映 ...
2026-06-25在Excel数据汇总、财务统计、业务复盘等日常办公场景中,经常需要完成逐行相乘、整体汇总求和的计算需求,最典型的场景就是:单 ...
2026-06-25 很多数据分析师沉迷于复杂的机器学习算法,却忽略了数据分析最基础也最核心的能力——描述性统计。事实上,80%的商业分析问 ...
2026-06-25【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17