京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据和数据分析师!
我们总是故意或无意跑偏,自从大数据火了以后,数据分析师摇身一变,成了大家眼中红人。貌似,有了分析师的分析以后,一个产品或者业务就能循着增长的曲线来前进,不再陷入那深深的黑暗中。可是,阿里巴巴创业的黑暗期,可有数据去分析?
没有数据分析,那玩什么?又怎么成功的?这个问题很重要,值得每个数据分析师去思考那个答案。舍本逐末。见利忘义。我们总是会掉到这个坑里面。比如教育,我们也会去谈“教育的目的”,但是,多少人真正懂得教育的目的?就算懂了,我们做的是否就是朝着这个目的来做?而不是做了一些看似合理但是以自己利益为驱动的事情?比如自由和民主,我们是真的不懂么?但是,我们的自由和民主,多少是口口声声的自由和民主?世界就是这个样子,目标就在那里,可是因为我们的愚昧、利益,我们又“顺其自然”的做了很多很多看似合理,其实完全错误的事情。教育这样,政治这样,工作和创业依然。我们都确定了工作和创业的方向了,最后在一个人,或者一帮人,经过日夜的讨论,打拼之后,发现跑偏了!崔健的《像一把刀子》里面有这样一句歌词:“这时我的心就像一把刀子,它要穿过你的喉咙去吻你的肺……”思考和解决问题的时候,我们就要用这样的态度,往往要穿过问题的喉咙去探它的肺才可以找到答案——像一把刀子。——From 李笑来
1,数据的前世今生
有了光,有了人,才有了世界。
有了人,有了产品,才有了数据。
从这个角度上说,数据是一个衍生品,而不是根本。
根据历史追溯,最初的“数据”是不是应该属于“结绳”?一天过去了,就系一个绳子疙瘩。
原始人从结绳开始,刻一些壁画,慢慢的进入了文字的世界。中国古代的数据,文本数据占大多数,比如经史子集,书法诗歌等等。进入近代社会,尤其伴随西方科学推动商业的发展,数值数据量随着商业膨胀的越来越大。现在我们说的数据,主要就是数值数据,和文本数据。
为什么大数据最近才有?因为近几年数值数据在互联网发展的效应下,记录和存储技术方面有了更多的突破,所以可以利用的数据越来越多。
为什么大数据会火呢?因为大家觉得大数据是“人”的行为痕迹,貌似知道了人的痕迹就可以知道这个人了。为什么以前不可以?以前不是不可以,我们有占卜、算命,也是根据数据来分析和预测,只不过这个数据太少,不能完全匹配人的行为,也就不能完全“还原”一个人。现在呢,大数据其实也是“算命”,只不过有了更多的数据而已。
2,数据人如何定位?
公司为什么会区分职位?
为什么不同的人有不同的技能?
因为专业的人,做事效率高,做事情成本低。
数据分析师,数据挖掘呢?
听着好牛啊,工资也高。可是,老陆的CEO的职位更好听,工资更高。认识世界有很多种,可以瞎猜,可以YY,可以去问,也可以通过数据。通过数据来看产品,是目前大家觉得最方便、最省力、最接近人真实情况的一种方式。只能说趋近人,到底趋近度多少,不知道。所以,相对PD和运营,数据人(分析师、挖掘)只是从另外一个视角来看产品和描述产品。仅此而已。产品是第一位,不管是产品经理、运营、分析师、挖掘工程师、算法等等,最终服务的都是这个“产品”。只不过,在去“罗马”这条路上,每个JOB TITLE的路不一样,责任不一样。就像一盘棋,每个棋子的作用不会很大,但是全部的棋子组合起来就可以决定输或者赢。
3,数据怎么去用?有了大数据,有了数据挖掘,感觉世界都可以换新天了。
数据到底如何去使用?数据分析,数据挖掘,数据可视化,各种词汇包围着“大数据”。一看上去,只要涉足这三个行业,就身价倍增的样子。看流量,看成交,写专题,做报告。每个里面都是图表,每个里面都有看似真实的世界的表现——数据。可是,做了这些东西以后,然后呢?
再然后呢?我们有了专题,我们也有了报告,我们更有了数据。但是,我们想过我们最初要什么?我们看数据是为了什么?我们做数据挖掘是为了什么?看数据,可能可以知道产品变化的地方,但是背后的原因我们知道么?产品背后为什么会有这样的变动?用户——这个所谓的人,TA们为什么会这样变化,为什么没有向另外的方向变化?这些是数据解释不了的。
4,数据靠谱么?
数据-------->>>>>>人,貌似数据越多,我们越可以趋近这个人,更好的“还原”这个人。有了大量的有关“人”的数据,大家觉得就可以去“还原”一个人了。从概率上来说,这个准确度确实在提高。但是有一个问题:我们是否拿到了足够的数据,以及是否拿到最能代表一个人的那些数据?搜索行为,购买记录,收藏点击,聊天记录,等等等。它是一个人真正的表现么?这些好多好多的数据,到底是一个人购物过程用到的数据的多少呢?我经常在考虑一个问题:我了解我自己么?我到底是怎么样一个人?我爱好什么?我喜欢什么?我的情绪怎么样变化?我发现我很难了解我自己。人啊,要认识自己。可是多么难。自己都不了解自己,数据真的可以么?
如果拿到的数据,只能预测一个人在某个时间段的5%的行为,是否有用?有人说,当然有用啊,不然推荐算法的效果是乱说的么?可是,我们怎么可以清晰的证明,人没有受到推荐的影响,而是真正的想购买或者点击?理性之非理性的情况下,点击和购买成本如此之低,随便买买和点点也可以吧?数据 = 人?这个等式永远不成立。可能大家在追求5%*人 = 数据?,或者更多。
5,世界的本质
说到最后,发现貌似数据分析,数据挖掘也没啥。恩,马总不懂挖掘,可以成功。乔布斯也不懂数据和挖掘,也不看用户分析和调研。为啥他们可以成功?因为他们可以更好的认识世界。认识世界,似乎可以从“道”和“术”两个维度来说。道,宇宙的法则;术,道的体现。道是本质,比如,人就是会倾向用“简单易用、符合天性“的产品;而iphone的畅销,仅仅是它顺承了人的天性而已。“术”可以做啥?通过iphone销量的分析,我们可以确定产品的确是符合“道”的;另外,通过分析和挖掘等,可以让这个IPHONE产品改进的更好,或者有Iphone 6这种大屏的新产品出来,可以卖更多的产品。从IPHONE的升级换代来看,本质的”道“没变——简单易用,其他的变得太多了。但是,万变不离其宗,所有的产品无不在“简单易用”这个法则上去无限的靠近,比如iphone 6,锤子。这个“道”,它就是自然存在的。是不是可以通过数据分析和挖掘发现呢?很难。但不是不可能。想想物理学中的定律,发现它们何其难。
6,现实呢,我们在做啥?
如果记录的数据有问题,或者有偏颇,数据分析的结果就是错的,一点价值木有。咳咳咳!分析师总觉得我觉得数据是这样子的,为啥产品不可以对应的去做,我们应该这样去做啊。但是,数据的表现,真的是产品后面的人体现出来的么?分析了一个又一个案例,分享了一个又一个案例,分析师好牛啊。等等,小明,把名字换成小王,这个题目你会做么?我们总是对产品,对数据分析又分析,从来没想想,产品和数据都是谁的产品和数据。到底,我们做的产品和数据是为了啥?是不是“人”才是我们最应该去回答的问题?如果产品不是为了“人”去做,如果数据不是还原“人”,我们的结果到底有啥价值?就算有点意义,是不是也是错的?
7,回到前言
不管是数据分析,产品经理,数据挖掘,运营,最终回归到的一个地方,就是:商业。商业的组成部分是:人。所以,全部的工作的核心就是:商业和人。这三个字,不管是数据分析、数据挖掘过程中,还是结果的展示中,都是我们唯一需要做的。这个就是数据的本质,也是数据分析师的本职。其他的分析也好,挖掘也罢,可视化也好,就是让人更好的去理解 商业和人 的途径和形式。无他。切莫舍本逐末,切莫看到了“1,2,3”便大叫,“吾得矣”,切莫做理性之非理性的事情。
8,世界很简单,又很复杂
道生一,一生二,三生万物。一,二,三。看着真简单。阴阳。两仪。八卦。六十四卦。简单中蕴藏着万物变动。但是,如果我们知道了世界运行的框架,是不是就会在复杂中看到最初的简单的一、二、三?对于数据分析师来说,最难也是最重要的,莫过于知道某个框架,了解其中的一、二、三。这样,不管这个题目是小明,还是小王,是去买菜,还是买水果,甚至是买钻石,都能更好的分析,理解。而框架是什么呢?我个人现在的选择是:人性和自然。
9,人性和自然
太阳从东方升起,从西方降落。
春花秋月,寒来暑往。
没有什么是固定的,本来就是无常,这个就是自然。
社会发展趋势,科技发展趋势,商业发展,莫不如此。
贪,嗔,痴。
说的细化一些,贪美,贪乐,贪吃,贪心,等等。
人的本性如此。
掌握了自然发展规律,了解人性,就明白了产品应该如何去做。
如果人人都发掘出“佛性”,即有出离心。
世界没有商业的存在。
本来,原始人就没有商业。一样可以存活。虽然不是更好的存活。
10,如何做一个数据分析师
我现在对于“数据分析师”这个title,关注已经越来越淡了。
如果要说如何做一个数据分析师,那就再啰嗦说几点自己的看法:
掌握一门功夫(编程语言,比如R,SQL,Python),练练套路(比如可视化,挖掘,分析方法),这些是硬实力。如果这个不会,很难在江湖上混了。
功夫在诗外。纵观古今,有大成就者,必定是格局的大。太极的厉害,不是套路的厉害,而是它的本质规律的厉害,即以柔克刚。认清和掌握了以柔克刚,太极功夫会更厉害。这是一个人的软实力。要具备这样的格局和软实力,分析师需要通过各种方式和途径去提高自己对本质——商业和人 的认识,比如看书,听讲座,请教,思考。这些功夫在分析师工作之外的,但是非常重要。个人觉得,软实力 > 硬实力。大师之所以是大师,在于TA视野和格局的大。世界本没有数据分析师,说的人多了,就有了数据分析师。如此而已。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据驱动运营的时代,指标是连接业务目标与实际行动的核心桥梁,是企业解读业务现状、发现问题、预判趋势的“量化标尺”。一套 ...
2026-05-08在存量竞争日趋激烈的商业时代,“以客户为中心”早已从口号落地为企业运营的核心逻辑。而客户画像作为打通“了解客户”与“服务 ...
2026-05-08 很多数据分析师每天与Excel打交道,但当被问到“什么是表格结构数据”“它和表结构数据有什么区别”“表格结构数据有哪些核 ...
2026-05-08在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-05-07在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27