京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据分析师不是单纯做数学题 不懂商业就别谈数据
前一段日子见到一位数据发烧友,我们两个有一个一致的观点:电子商务发展速度越来越快,这个行业的趋势变化也越来越快。对于电子商务公司老板来说,想要自己永远跟着趋势走,学会数据驱动是必然的了。
庆幸的是,今年搞电子商务的人对数据分析开始重视起来了,就连夫妻店起来的淘宝卖家也开始招数据分析师,更别谈一些再大些的电子商务公司。
但是,这让我心存隐忧:现在不是缺数据,而是数据太多。据统计,在今天的互联网上,每60秒会产生10万个微薄信息、400万次search、facebook上50万次contact。我相信,今天稍大一些的电子商务公司,都会采集一些行为数据(比如点击量),但是这些行为数据与商业数据(比如交易量)有什么关系?今天绝多数公司,甚至包括凡客这样的著名电子商务公司,都不知道怎样利用这成千上万的零散数据。
需要数据逻辑,更需要商业敏感
先讲一个有趣的故事。有一天,linkin发现忽然发现雷曼兄弟的来访者多起来了,但是并没有深究原因,第二天雷曼兄弟就宣布倒闭了。原因是什么?雷曼兄弟的人到linkin来找工作了。谷歌宣布退出中国的前一个月,我在linkedin发现了一些平时很少见的谷歌的产品经理在线,这也是相同的道理。
试想,如果linkin针对某家上市公司分析某些数据,是不是有商业价值呢?我相信,现在51job绝对不知道要采集这些数据,只盯着注册用户数量这样的简单数据。国内许多互联网公司,拿着鱼翅当萝卜。
说这个故事,只是为了告诉大家,互联网中的数据,需要用商业的眼光去分析,才有价值。
今天电子商务公司的数据分析师,有些像老板的军师,必须有从枯燥的数据中看到解开市场的密码的本事。
比如,当一个具有商业意识的数据分析师发现,网站上的婴儿车的销量增加了,那么他基本可以预测奶粉的销量也会跟着上去。
再比如,和传统卖场一样,网站上的产品起到的作用并不一样,有的产品是为了赚钱,有的产品是为了促销的,有的产品是为了引流量,不同的产品在网站上摆放位置当然是不一样的。
一个商业敏感的数据分析师,是懂得用什么数据驱动公司目标实现的。
比如,乐酷天与淘宝竞争,重点看的不是交易量,而是流量,每天有多少新的seller进来,卖了多少东西。因为此阶段的饿竞争最核心的就是人气,而非实质交易量。如果新来的seller进来卖不出东西,只是老的seller的交易量在增长,即使最后交易量每天都增长,还是有问题。
再比如,一家刚踏入市场的B2C和已经占领大部分市场的B2C,他们的公司目标是不一样的,前者是看流量赚人气,流量对后者的意义没有那么大,成熟的公司重点是看交易,转化率及回头率的。。
而当下的数据分析师多是学统计学出身的,一对数据放在那里,大家都擅长怎么算回归、怎么画函数。但是这批数学的人才缺乏商业意识,不知道这些数据对业务意味着什么,看不见一堆数据中谁和谁有关系,也就不知道该用什么的逻辑分析,也就无法充当老板的眼睛了。
前几天遇到一个老板,他说手下每天给他看几十个零散数据。我问,是不是数据越多越麻烦。他说我一下子就点出他的痛处了,因为请来的数据分析专家只把数据交到他面前,但是却没有把行为数据和商业数据的关系告诉他。
你说,一个公司CEO,每天看到几十个数据,什么PV、PU、UV等等等,他们有精力来解读吗?对于他们来说,只需要知道有问题吗?问题是什么?有新的发现吗?需要做什么?这就行了。
我把这个理解成为数据的世界里的“仪表盘”,比如说网站流量进来弹出率怎样就可以在仪表盘里呈现。你开车,如果水温过高,仪表盘亮灯提示。同样,在电子商务的交易中,也可以用一些数据组成“仪表盘”。
所以说,数据分析师不是单纯做数学题。
行为数据和商业数据,互相推动
一个好的仪表盘,出现好的情况和坏的情况,仪表盘都会有提示。而构成“仪表盘”,正是行为数据和商业数据之间的逻辑关系。
我自己发明了一种称谓:前端行为数据和后端商业数据。前段数据指访问量、浏览量、点击流及站内搜索等反应用户行为的数据,而后端数据更侧重商业数据,比如交易量、ROI, LTV(Life time Value)。
目前有些人关心行为数据,也有些人关心商业数据,但是没有几家网站是把行为数据和商业数据连起来看的。大家只单纯看某一端数据。国内小有名气的网站CEO,每天也只看一个结果数据:网站今天的成交量是多少,卖了多少件产品。
但是看数据看得走火入魔的人会明白,每个数据,就像散布在黑夜里的星星,它们之间彼此布满了关系网,只要轻轻按一下其中一个数据,就会驱动另外一个数据的变化。
大家都比较关心网站用户群,就以此举例子。
某一天,某网站发现自己的前端的注册量增加了不少,访问量也上去了,交易量却没有上去,不死不活。
原因是什么?这是许多网站的通病,每天有许多脑子在想这个问题。现在这个阶段,处在互联网前段的人只知道点击量等数据,很少问后端的商业数据,如谁一直在重复购买?谁影响了5%~15%核心用户群进来买东西?谁在给网站做正/负面传播?
而操作网站后端交易环节的人只知道卖东西,又很少问到前端数据,如一个客户进来网站平均停留时间了15分钟还是30分钟,这对将来重复购买的关系大吗?一个客户进了网站社区和没进社区,对产生交易量有关系吗?
找不到核心用户群的原因,很大原因是没有把行为数据与商业数据对接来看。
于是,前后端数据割裂,没有人知道其中的关系。作为网站的决策者,不知道网站的核心用户群的行为特徵,也不知道怎样刺激核心用户的增加,更不知道从一个用户进来网站之后到走出去,哪些环节是需要疏通。
当然这只是一个管中窥豹而已。一个平台运营商,反应用户行为的前端数据与后端的商业数据千千万万,卖家和买家也是千千万万,其中前端哪个数据对整个网站后端的交易量产生最大影响,只要针对这个前端数据猛下药,必然会刺激后端数据的增加;反过来,后端哪个交易数据比较高,摸清楚是从哪个渠道来的,主要贡献用户是谁,网站的产品设计就要倾斜于他们,对他们好一点,如此才会渠道前端的“转化率”等关键数据的提升。
如果一个网站的核心用户群每月以10%的速度在增长,不火也是怪事。
遗憾的是,今天许多电子商务公司,每天都在做“碰巧”游戏:今天推荐A家产品,明天撤下A家的产品,今天做低价促销,明天又做线下活动。这些决策的改变,没有仪表盘的指示或良好的监控,都是蒙着眼睛在碰巧。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在统计学分析、实验研究、业务数据复盘过程中,单因素方差分析是检验自变量对因变量是否存在显著影响的核心方法。其中,两个水平 ...
2026-05-26【核心关键词】算法、客户、大数据、互联网、调优、建模、模型优化、机器学习、评分卡模型、模型开发、智能风控、业务场景、数 ...
2026-05-26 很多数据分析师写过无数个 SELECT,但当被问到“新建一张表,该如何定义字段类型来保证数据质量”“创建视图和存储物理表有 ...
2026-05-26在数据清洗、统计分析与数据质量检测工作中,箱型图(又称箱线图、Box Plot)是最直观、最高效的可视化分析工具之一。相较于柱状 ...
2026-05-25在大数据分析、数据清洗、质量管控、风险监测等领域,异常数据识别是保障数据质量、确保分析结论精准、规避业务决策失误的核心基 ...
2026-05-25 很多数据分析师精通Excel函数和透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么关系 ...
2026-05-25数字化经营时代,企业的市场竞争早已从经验决策转向数据决策。门店营收、用户转化、产品销量、成本损耗、存量资产等所有经营行为 ...
2026-05-22在MySQL数据库日常运维、业务数据校验、数据迁移与数据清洗场景中,自增主键ID的连续性校验是一项基础且关键的工作。MySQL的Auto ...
2026-05-22 很多企业团队并非缺乏指标,而是陷入“指标失控”:仪表盘上堆满实时跳动的数据,却无法回答“当前瓶颈在哪、下一步该做什么 ...
2026-05-22【核心关键词】大数据、可视化、存储、架构、客户、离线、产品、同步、实时、数据仓库、数据分析、数据可视化、存储数据、离线 ...
2026-05-21在电商流量红利消退、公域获客成本持续走高的当下,存量用户深度挖掘已成为店铺增收增效的核心抓手。相较于付费投放获取的陌生新 ...
2026-05-21 很多数据分析师每天盯着几十个指标,但当被问到“这套指标要支撑什么业务目标”“指标之间是什么逻辑关系”“业务变化时如何 ...
2026-05-21在数据驱动决策的时代,数据质量直接决定分析结果的可靠性与准确性,而异常值作为数据清洗中的核心痛点,往往会扭曲分析结论、误 ...
2026-05-20 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标在所有行业都适用”“哪些指标只对电商有意义”“二者如何搭 ...
2026-05-20Agent的能力边界,很大程度上取决于其掌握的Skill质量和数量。传统做法是靠人工编写和维护Skill,但这条路很快会遇到瓶颈。业务 ...
2026-05-20在统计分析中,方差分析(ANOVA)是一种常用的假设检验方法,核心用于分析“一个或多个自变量对单个因变量的影响”,广泛应用于 ...
2026-05-19 很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“什么是指标”“指标和维度有什么区别”“如何定义指标值的计算规则和 ...
2026-05-19想高效备考 CDA 一级,拒绝盲目刷题、冗余学习?《CDA 一级教材知识手册》重磅来袭!以官方教材为核心,浓缩 13 章 103 个核心考 ...
2026-05-19在数据统计分析中,卡方检验是一种常用的非参数检验方法,核心用于判断两个或多个分类变量之间是否存在显著关联,广泛应用于市场 ...
2026-05-18在企业数字化转型的浪潮中,很多企业陷入了“技术堆砌”的误区——上线了ERP、CRM、BI等各类系统,积累了海量数据,却依然面临“ ...
2026-05-18