京公网安备 11010802034615号
经营许可证编号:京B2-20210330
数据和数据分析师!
我们总是故意或无意跑偏,自从大数据火了以后,数据分析师摇身一变,成了大家眼中红人。貌似,有了分析师的分析以后,一个产品或者业务就能循着增长的曲线来前进,不再陷入那深深的黑暗中。可是,阿里巴巴创业的黑暗期,可有数据去分析?
没有数据分析,那玩什么?又怎么成功的?这个问题很重要,值得每个数据分析师去思考那个答案。舍本逐末。见利忘义。我们总是会掉到这个坑里面。比如教育,我们也会去谈“教育的目的”,但是,多少人真正懂得教育的目的?就算懂了,我们做的是否就是朝着这个目的来做?而不是做了一些看似合理但是以自己利益为驱动的事情?比如自由和民主,我们是真的不懂么?但是,我们的自由和民主,多少是口口声声的自由和民主?世界就是这个样子,目标就在那里,可是因为我们的愚昧、利益,我们又“顺其自然”的做了很多很多看似合理,其实完全错误的事情。教育这样,政治这样,工作和创业依然。我们都确定了工作和创业的方向了,最后在一个人,或者一帮人,经过日夜的讨论,打拼之后,发现跑偏了!崔健的《像一把刀子》里面有这样一句歌词:“这时我的心就像一把刀子,它要穿过你的喉咙去吻你的肺……”思考和解决问题的时候,我们就要用这样的态度,往往要穿过问题的喉咙去探它的肺才可以找到答案——像一把刀子。——From 李笑来
1,数据的前世今生
有了光,有了人,才有了世界。
有了人,有了产品,才有了数据。
从这个角度上说,数据是一个衍生品,而不是根本。
根据历史追溯,最初的“数据”是不是应该属于“结绳”?一天过去了,就系一个绳子疙瘩。
原始人从结绳开始,刻一些壁画,慢慢的进入了文字的世界。中国古代的数据,文本数据占大多数,比如经史子集,书法诗歌等等。进入近代社会,尤其伴随西方科学推动商业的发展,数值数据量随着商业膨胀的越来越大。现在我们说的数据,主要就是数值数据,和文本数据。
为什么大数据最近才有?因为近几年数值数据在互联网发展的效应下,记录和存储技术方面有了更多的突破,所以可以利用的数据越来越多。
为什么大数据会火呢?因为大家觉得大数据是“人”的行为痕迹,貌似知道了人的痕迹就可以知道这个人了。为什么以前不可以?以前不是不可以,我们有占卜、算命,也是根据数据来分析和预测,只不过这个数据太少,不能完全匹配人的行为,也就不能完全“还原”一个人。现在呢,大数据其实也是“算命”,只不过有了更多的数据而已。
2,数据人如何定位?
公司为什么会区分职位?
为什么不同的人有不同的技能?
因为专业的人,做事效率高,做事情成本低。
数据分析师,数据挖掘呢?
听着好牛啊,工资也高。可是,老陆的CEO的职位更好听,工资更高。认识世界有很多种,可以瞎猜,可以YY,可以去问,也可以通过数据。通过数据来看产品,是目前大家觉得最方便、最省力、最接近人真实情况的一种方式。只能说趋近人,到底趋近度多少,不知道。所以,相对PD和运营,数据人(分析师、挖掘)只是从另外一个视角来看产品和描述产品。仅此而已。产品是第一位,不管是产品经理、运营、分析师、挖掘工程师、算法等等,最终服务的都是这个“产品”。只不过,在去“罗马”这条路上,每个JOB TITLE的路不一样,责任不一样。就像一盘棋,每个棋子的作用不会很大,但是全部的棋子组合起来就可以决定输或者赢。
3,数据怎么去用?有了大数据,有了数据挖掘,感觉世界都可以换新天了。
数据到底如何去使用?数据分析,数据挖掘,数据可视化,各种词汇包围着“大数据”。一看上去,只要涉足这三个行业,就身价倍增的样子。看流量,看成交,写专题,做报告。每个里面都是图表,每个里面都有看似真实的世界的表现——数据。可是,做了这些东西以后,然后呢?
再然后呢?我们有了专题,我们也有了报告,我们更有了数据。但是,我们想过我们最初要什么?我们看数据是为了什么?我们做数据挖掘是为了什么?看数据,可能可以知道产品变化的地方,但是背后的原因我们知道么?产品背后为什么会有这样的变动?用户——这个所谓的人,TA们为什么会这样变化,为什么没有向另外的方向变化?这些是数据解释不了的。
4,数据靠谱么?
数据-------->>>>>>人,貌似数据越多,我们越可以趋近这个人,更好的“还原”这个人。有了大量的有关“人”的数据,大家觉得就可以去“还原”一个人了。从概率上来说,这个准确度确实在提高。但是有一个问题:我们是否拿到了足够的数据,以及是否拿到最能代表一个人的那些数据?搜索行为,购买记录,收藏点击,聊天记录,等等等。它是一个人真正的表现么?这些好多好多的数据,到底是一个人购物过程用到的数据的多少呢?我经常在考虑一个问题:我了解我自己么?我到底是怎么样一个人?我爱好什么?我喜欢什么?我的情绪怎么样变化?我发现我很难了解我自己。人啊,要认识自己。可是多么难。自己都不了解自己,数据真的可以么?
如果拿到的数据,只能预测一个人在某个时间段的5%的行为,是否有用?有人说,当然有用啊,不然推荐算法的效果是乱说的么?可是,我们怎么可以清晰的证明,人没有受到推荐的影响,而是真正的想购买或者点击?理性之非理性的情况下,点击和购买成本如此之低,随便买买和点点也可以吧?数据 = 人?这个等式永远不成立。可能大家在追求5%*人 = 数据?,或者更多。
5,世界的本质
说到最后,发现貌似数据分析,数据挖掘也没啥。恩,马总不懂挖掘,可以成功。乔布斯也不懂数据和挖掘,也不看用户分析和调研。为啥他们可以成功?因为他们可以更好的认识世界。认识世界,似乎可以从“道”和“术”两个维度来说。道,宇宙的法则;术,道的体现。道是本质,比如,人就是会倾向用“简单易用、符合天性“的产品;而iphone的畅销,仅仅是它顺承了人的天性而已。“术”可以做啥?通过iphone销量的分析,我们可以确定产品的确是符合“道”的;另外,通过分析和挖掘等,可以让这个IPHONE产品改进的更好,或者有Iphone 6这种大屏的新产品出来,可以卖更多的产品。从IPHONE的升级换代来看,本质的”道“没变——简单易用,其他的变得太多了。但是,万变不离其宗,所有的产品无不在“简单易用”这个法则上去无限的靠近,比如iphone 6,锤子。这个“道”,它就是自然存在的。是不是可以通过数据分析和挖掘发现呢?很难。但不是不可能。想想物理学中的定律,发现它们何其难。
6,现实呢,我们在做啥?
如果记录的数据有问题,或者有偏颇,数据分析的结果就是错的,一点价值木有。咳咳咳!分析师总觉得我觉得数据是这样子的,为啥产品不可以对应的去做,我们应该这样去做啊。但是,数据的表现,真的是产品后面的人体现出来的么?分析了一个又一个案例,分享了一个又一个案例,分析师好牛啊。等等,小明,把名字换成小王,这个题目你会做么?我们总是对产品,对数据分析又分析,从来没想想,产品和数据都是谁的产品和数据。到底,我们做的产品和数据是为了啥?是不是“人”才是我们最应该去回答的问题?如果产品不是为了“人”去做,如果数据不是还原“人”,我们的结果到底有啥价值?就算有点意义,是不是也是错的?
7,回到前言
不管是数据分析,产品经理,数据挖掘,运营,最终回归到的一个地方,就是:商业。商业的组成部分是:人。所以,全部的工作的核心就是:商业和人。这三个字,不管是数据分析、数据挖掘过程中,还是结果的展示中,都是我们唯一需要做的。这个就是数据的本质,也是数据分析师的本职。其他的分析也好,挖掘也罢,可视化也好,就是让人更好的去理解 商业和人 的途径和形式。无他。切莫舍本逐末,切莫看到了“1,2,3”便大叫,“吾得矣”,切莫做理性之非理性的事情。
8,世界很简单,又很复杂
道生一,一生二,三生万物。一,二,三。看着真简单。阴阳。两仪。八卦。六十四卦。简单中蕴藏着万物变动。但是,如果我们知道了世界运行的框架,是不是就会在复杂中看到最初的简单的一、二、三?对于数据分析师来说,最难也是最重要的,莫过于知道某个框架,了解其中的一、二、三。这样,不管这个题目是小明,还是小王,是去买菜,还是买水果,甚至是买钻石,都能更好的分析,理解。而框架是什么呢?我个人现在的选择是:人性和自然。
9,人性和自然
太阳从东方升起,从西方降落。
春花秋月,寒来暑往。
没有什么是固定的,本来就是无常,这个就是自然。
社会发展趋势,科技发展趋势,商业发展,莫不如此。
贪,嗔,痴。
说的细化一些,贪美,贪乐,贪吃,贪心,等等。
人的本性如此。
掌握了自然发展规律,了解人性,就明白了产品应该如何去做。
如果人人都发掘出“佛性”,即有出离心。
世界没有商业的存在。
本来,原始人就没有商业。一样可以存活。虽然不是更好的存活。
10,如何做一个数据分析师
我现在对于“数据分析师”这个title,关注已经越来越淡了。
如果要说如何做一个数据分析师,那就再啰嗦说几点自己的看法:
掌握一门功夫(编程语言,比如R,SQL,Python),练练套路(比如可视化,挖掘,分析方法),这些是硬实力。如果这个不会,很难在江湖上混了。
功夫在诗外。纵观古今,有大成就者,必定是格局的大。太极的厉害,不是套路的厉害,而是它的本质规律的厉害,即以柔克刚。认清和掌握了以柔克刚,太极功夫会更厉害。这是一个人的软实力。要具备这样的格局和软实力,分析师需要通过各种方式和途径去提高自己对本质——商业和人 的认识,比如看书,听讲座,请教,思考。这些功夫在分析师工作之外的,但是非常重要。个人觉得,软实力 > 硬实力。大师之所以是大师,在于TA视野和格局的大。世界本没有数据分析师,说的人多了,就有了数据分析师。如此而已。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在互联网产品运营、用户增长的实战场景中,很多从业者都会陷入一个误区:盲目投入资源做推广、拉新,却忽视了“拉新后的用户激活 ...
2026-02-06在机器学习建模过程中,特征选择是决定模型性能的关键环节——面对动辄几十、上百个特征的数据(如用户画像的几十项维度、企业经 ...
2026-02-06在CDA(Certified Data Analyst)数据分析师的日常实操中,表格结构数据是贯穿全流程的核心载体,而对表格数据类型的精准识别、 ...
2026-02-06在日常办公数据分析中,我们经常会面对杂乱无章的批量数据——比如员工月度绩效、产品销售数据、客户消费金额、月度运营指标等。 ...
2026-02-05在分类模型(如风控反欺诈、医疗疾病诊断、客户流失预警)的实操落地中,ROC曲线是评估模型区分能力的核心工具,而阈值则是连接 ...
2026-02-05对CDA(Certified Data Analyst)数据分析师而言,数据分析的价值不仅在于挖掘数据背后的规律与洞察,更在于通过专业的报告呈现 ...
2026-02-05在数据分析实战中,我们经常会遇到“多指标冗余”的问题——比如分析企业经营状况时,需同时关注营收、利润、负债率、周转率等十 ...
2026-02-04在数据分析场景中,基准比是衡量指标表现、评估业务成效、对比个体/群体差异的核心工具,广泛应用于绩效评估、业务监控、竞品对 ...
2026-02-04业务数据分析是企业日常运营的核心支撑,其核心价值在于将零散的业务数据转化为可落地的业务洞察,破解运营痛点、优化业务流程、 ...
2026-02-04在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03在数字化业务迭代中,AB测试已成为验证产品优化、策略调整、运营活动效果的核心工具。但多数业务场景中,单纯的“AB组差异对比” ...
2026-02-03企业战略决策的科学性,决定了其长远发展的格局与竞争力。战略分析方法作为一套系统化、专业化的思维工具,为企业研判行业趋势、 ...
2026-02-03在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29