
数据和数据分析师!
我们总是故意或无意跑偏,自从大数据火了以后,数据分析师摇身一变,成了大家眼中红人。貌似,有了分析师的分析以后,一个产品或者业务就能循着增长的曲线来前进,不再陷入那深深的黑暗中。可是,阿里巴巴创业的黑暗期,可有数据去分析?
没有数据分析,那玩什么?又怎么成功的?这个问题很重要,值得每个数据分析师去思考那个答案。舍本逐末。见利忘义。我们总是会掉到这个坑里面。比如教育,我们也会去谈“教育的目的”,但是,多少人真正懂得教育的目的?就算懂了,我们做的是否就是朝着这个目的来做?而不是做了一些看似合理但是以自己利益为驱动的事情?比如自由和民主,我们是真的不懂么?但是,我们的自由和民主,多少是口口声声的自由和民主?世界就是这个样子,目标就在那里,可是因为我们的愚昧、利益,我们又“顺其自然”的做了很多很多看似合理,其实完全错误的事情。教育这样,政治这样,工作和创业依然。我们都确定了工作和创业的方向了,最后在一个人,或者一帮人,经过日夜的讨论,打拼之后,发现跑偏了!崔健的《像一把刀子》里面有这样一句歌词:“这时我的心就像一把刀子,它要穿过你的喉咙去吻你的肺……”思考和解决问题的时候,我们就要用这样的态度,往往要穿过问题的喉咙去探它的肺才可以找到答案——像一把刀子。——From 李笑来
1,数据的前世今生
有了光,有了人,才有了世界。
有了人,有了产品,才有了数据。
从这个角度上说,数据是一个衍生品,而不是根本。
根据历史追溯,最初的“数据”是不是应该属于“结绳”?一天过去了,就系一个绳子疙瘩。
原始人从结绳开始,刻一些壁画,慢慢的进入了文字的世界。中国古代的数据,文本数据占大多数,比如经史子集,书法诗歌等等。进入近代社会,尤其伴随西方科学推动商业的发展,数值数据量随着商业膨胀的越来越大。现在我们说的数据,主要就是数值数据,和文本数据。
为什么大数据最近才有?因为近几年数值数据在互联网发展的效应下,记录和存储技术方面有了更多的突破,所以可以利用的数据越来越多。
为什么大数据会火呢?因为大家觉得大数据是“人”的行为痕迹,貌似知道了人的痕迹就可以知道这个人了。为什么以前不可以?以前不是不可以,我们有占卜、算命,也是根据数据来分析和预测,只不过这个数据太少,不能完全匹配人的行为,也就不能完全“还原”一个人。现在呢,大数据其实也是“算命”,只不过有了更多的数据而已。
2,数据人如何定位?
公司为什么会区分职位?
为什么不同的人有不同的技能?
因为专业的人,做事效率高,做事情成本低。
数据分析师,数据挖掘呢?
听着好牛啊,工资也高。可是,老陆的CEO的职位更好听,工资更高。认识世界有很多种,可以瞎猜,可以YY,可以去问,也可以通过数据。通过数据来看产品,是目前大家觉得最方便、最省力、最接近人真实情况的一种方式。只能说趋近人,到底趋近度多少,不知道。所以,相对PD和运营,数据人(分析师、挖掘)只是从另外一个视角来看产品和描述产品。仅此而已。产品是第一位,不管是产品经理、运营、分析师、挖掘工程师、算法等等,最终服务的都是这个“产品”。只不过,在去“罗马”这条路上,每个JOB TITLE的路不一样,责任不一样。就像一盘棋,每个棋子的作用不会很大,但是全部的棋子组合起来就可以决定输或者赢。
3,数据怎么去用?有了大数据,有了数据挖掘,感觉世界都可以换新天了。
数据到底如何去使用?数据分析,数据挖掘,数据可视化,各种词汇包围着“大数据”。一看上去,只要涉足这三个行业,就身价倍增的样子。看流量,看成交,写专题,做报告。每个里面都是图表,每个里面都有看似真实的世界的表现——数据。可是,做了这些东西以后,然后呢?
再然后呢?我们有了专题,我们也有了报告,我们更有了数据。但是,我们想过我们最初要什么?我们看数据是为了什么?我们做数据挖掘是为了什么?看数据,可能可以知道产品变化的地方,但是背后的原因我们知道么?产品背后为什么会有这样的变动?用户——这个所谓的人,TA们为什么会这样变化,为什么没有向另外的方向变化?这些是数据解释不了的。
4,数据靠谱么?
数据-------->>>>>>人,貌似数据越多,我们越可以趋近这个人,更好的“还原”这个人。有了大量的有关“人”的数据,大家觉得就可以去“还原”一个人了。从概率上来说,这个准确度确实在提高。但是有一个问题:我们是否拿到了足够的数据,以及是否拿到最能代表一个人的那些数据?搜索行为,购买记录,收藏点击,聊天记录,等等等。它是一个人真正的表现么?这些好多好多的数据,到底是一个人购物过程用到的数据的多少呢?我经常在考虑一个问题:我了解我自己么?我到底是怎么样一个人?我爱好什么?我喜欢什么?我的情绪怎么样变化?我发现我很难了解我自己。人啊,要认识自己。可是多么难。自己都不了解自己,数据真的可以么?
如果拿到的数据,只能预测一个人在某个时间段的5%的行为,是否有用?有人说,当然有用啊,不然推荐算法的效果是乱说的么?可是,我们怎么可以清晰的证明,人没有受到推荐的影响,而是真正的想购买或者点击?理性之非理性的情况下,点击和购买成本如此之低,随便买买和点点也可以吧?数据 = 人?这个等式永远不成立。可能大家在追求5%*人 = 数据?,或者更多。
5,世界的本质
说到最后,发现貌似数据分析,数据挖掘也没啥。恩,马总不懂挖掘,可以成功。乔布斯也不懂数据和挖掘,也不看用户分析和调研。为啥他们可以成功?因为他们可以更好的认识世界。认识世界,似乎可以从“道”和“术”两个维度来说。道,宇宙的法则;术,道的体现。道是本质,比如,人就是会倾向用“简单易用、符合天性“的产品;而iphone的畅销,仅仅是它顺承了人的天性而已。“术”可以做啥?通过iphone销量的分析,我们可以确定产品的确是符合“道”的;另外,通过分析和挖掘等,可以让这个IPHONE产品改进的更好,或者有Iphone 6这种大屏的新产品出来,可以卖更多的产品。从IPHONE的升级换代来看,本质的”道“没变——简单易用,其他的变得太多了。但是,万变不离其宗,所有的产品无不在“简单易用”这个法则上去无限的靠近,比如iphone 6,锤子。这个“道”,它就是自然存在的。是不是可以通过数据分析和挖掘发现呢?很难。但不是不可能。想想物理学中的定律,发现它们何其难。
6,现实呢,我们在做啥?
如果记录的数据有问题,或者有偏颇,数据分析的结果就是错的,一点价值木有。咳咳咳!分析师总觉得我觉得数据是这样子的,为啥产品不可以对应的去做,我们应该这样去做啊。但是,数据的表现,真的是产品后面的人体现出来的么?分析了一个又一个案例,分享了一个又一个案例,分析师好牛啊。等等,小明,把名字换成小王,这个题目你会做么?我们总是对产品,对数据分析又分析,从来没想想,产品和数据都是谁的产品和数据。到底,我们做的产品和数据是为了啥?是不是“人”才是我们最应该去回答的问题?如果产品不是为了“人”去做,如果数据不是还原“人”,我们的结果到底有啥价值?就算有点意义,是不是也是错的?
7,回到前言
不管是数据分析,产品经理,数据挖掘,运营,最终回归到的一个地方,就是:商业。商业的组成部分是:人。所以,全部的工作的核心就是:商业和人。这三个字,不管是数据分析、数据挖掘过程中,还是结果的展示中,都是我们唯一需要做的。这个就是数据的本质,也是数据分析师的本职。其他的分析也好,挖掘也罢,可视化也好,就是让人更好的去理解 商业和人 的途径和形式。无他。切莫舍本逐末,切莫看到了“1,2,3”便大叫,“吾得矣”,切莫做理性之非理性的事情。
8,世界很简单,又很复杂
道生一,一生二,三生万物。一,二,三。看着真简单。阴阳。两仪。八卦。六十四卦。简单中蕴藏着万物变动。但是,如果我们知道了世界运行的框架,是不是就会在复杂中看到最初的简单的一、二、三?对于数据分析师来说,最难也是最重要的,莫过于知道某个框架,了解其中的一、二、三。这样,不管这个题目是小明,还是小王,是去买菜,还是买水果,甚至是买钻石,都能更好的分析,理解。而框架是什么呢?我个人现在的选择是:人性和自然。
9,人性和自然
太阳从东方升起,从西方降落。
春花秋月,寒来暑往。
没有什么是固定的,本来就是无常,这个就是自然。
社会发展趋势,科技发展趋势,商业发展,莫不如此。
贪,嗔,痴。
说的细化一些,贪美,贪乐,贪吃,贪心,等等。
人的本性如此。
掌握了自然发展规律,了解人性,就明白了产品应该如何去做。
如果人人都发掘出“佛性”,即有出离心。
世界没有商业的存在。
本来,原始人就没有商业。一样可以存活。虽然不是更好的存活。
10,如何做一个数据分析师
我现在对于“数据分析师”这个title,关注已经越来越淡了。
如果要说如何做一个数据分析师,那就再啰嗦说几点自己的看法:
掌握一门功夫(编程语言,比如R,SQL,Python),练练套路(比如可视化,挖掘,分析方法),这些是硬实力。如果这个不会,很难在江湖上混了。
功夫在诗外。纵观古今,有大成就者,必定是格局的大。太极的厉害,不是套路的厉害,而是它的本质规律的厉害,即以柔克刚。认清和掌握了以柔克刚,太极功夫会更厉害。这是一个人的软实力。要具备这样的格局和软实力,分析师需要通过各种方式和途径去提高自己对本质——商业和人 的认识,比如看书,听讲座,请教,思考。这些功夫在分析师工作之外的,但是非常重要。个人觉得,软实力 > 硬实力。大师之所以是大师,在于TA视野和格局的大。世界本没有数据分析师,说的人多了,就有了数据分析师。如此而已。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
机器学习解决实际问题的核心关键:从业务到落地的全流程解析 在人工智能技术落地的浪潮中,机器学习作为核心工具,已广泛应用于 ...
2025-09-09SPSS 编码状态区域中 Unicode 的功能与价值解析 在 SPSS(Statistical Product and Service Solutions,统计产品与服务解决方案 ...
2025-09-09CDA 数据分析师:驾驭商业数据分析流程的核心力量 在商业决策从 “经验驱动” 向 “数据驱动” 转型的过程中,商业数据分析总体 ...
2025-09-09R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01