京公网安备 11010802034615号
经营许可证编号:京B2-20210330
一张图读懂数据分析
前两天看到一张图,很好的诠释了从数据到数据分析的过程,今天分享给大家。
这四个步骤直译过来就是:数据-信息-展示-知识。不过图中的信息量远不止这八个字这么简单。可以说这张图体现了数据分析精髓,读透了就懂数据分析了。
——————-| 壹 |——————-
现实比图1更残酷,往往鸡蛋里面是混着蛋壳滴!数据源质量参差不齐,各种垃圾数据,各种无效数据。很多初级分析人员就用这样的数据开始劳作了。难道你们不知道还有一种工作叫数据清洗或数据整理么?建立在垃圾数据基础上的分析能是分析么?
有次见一个小表妹在分析VIP顾客的平均年龄(备注:时尚女装品牌),她用所有VIP会员年龄总和除以会员总数就得到了平均年龄。so easy,在excel表格里面几秒钟就能搞定。我想这样的平均年龄她一定会写到会员月度报告中去吧,领导们也会相信这是真的。正好想和这个妹妹聊会儿天,于是对她说你能用透视表筛选一下看看年龄段在60岁以上15岁以下的会员有多少吗?表妹不会透视表的年龄分段功能,于是我又手把手的教会了她。
该品牌的目标顾客年龄是25-35岁,不看不知道一看吓一跳,居然有6.9%的会员年龄是60+或15-(想想一个80岁的老太太会拉高不少平均年龄值滴)。这些就是会员年龄的垃圾数据,出现这种情况多半是店铺数据录入的时候没把好关,当然这个企业本身也不重视这些基础数据的收集。
——————-| 贰 |——————-
有些人的数据分析终止于图中的第二步,分析结果只是信息的堆积。无数次看见下属给领导的数据分析报告,各种数据,各种表格,密密麻麻的好几张sheet。领导要的结论呢?
“领导你自己看”(下属在心理面这样说)。
这种只有数据没有结论的数据分析报告充斥着我们的日常工作,受害者都是企业的管理者。
分析的时候将有价值的数据整合成信息只是数据分析的一个步骤,只罗列数据不叫分析,那个只是数据的搬运工。你们想做一辈子的搬运工吗?
将有价值的数据整合成有价值的信息是这个步骤的核心内容。
——————-| 叁 |——————-
有些人的数据分析终止于图中的第三步(展示),数据展现形式大于内容,空有漂亮的图表而无实质内容。这里面分成两类,一类是追求漂亮型,每张图表都有漂亮的配色,高大上的自定义数据图,把数据打扮成一个个花枝招展的春姑娘。
第二类是朴素型,有些人做了一辈子的图表只用过三种图:曲线图,饼图,柱状图(我把它们叫三俗图)。其实excel中的图表有很多,条形图、雷达图,股价图,堆积图等,还有变异的漏斗图,双轴图等等。可供选择的太多了,这种人就是懒!
数据展示要讲逻辑,图表必须要用最简单的逻辑把结论告诉受众,而不是简单的做成图就完了。时间序列,优先顺序,重要程度等都是图表可以利用的逻辑。
考大家一下,下面这张图你能发现几个错误或不符合逻辑的地方?
如果能找到3个以上问题的同学可以毕业了!大家可以在文章最后以评论的方式说出你找到图表的逻辑问题有哪些?
俗话说:千言万语不如一张图,但是好的图表才会自己说话!
——————-| 肆 |——————-
亮点总是在最后面,正如第四张图描述的一样,好的数据分析成果大部分会被受众吸收,转化成他们的知识(盘子里面只会剩下一点点面包屑)。没有前三个步骤的铺垫,转化的可能就不是知识而是糟粕了。
数据分析的目的是什么?你真的认真思索过这个问题吗?没有的请马上面壁三分钟然后再往下看。
1、认清事实
2、找出规律
3、预测未来
4、洞悉关系
这是我总结的数据分析的四大主要目的,无论是哪一个目的,最终你都是需要将分析成果让受众吸收。受众可以是别人,也可以是自己。数据分析人员的日常工作大部分是在认清事实和找出规律,而预测未来和洞悉关系占的比重很少。
我们在做数据分析报告的时候,一定要有价值的结论,并且准确无误的将结论传递给受众,否则大家都是在浪费时间。记住上面做汉堡的这张图,你不仅仅是为了汉堡好看,而是让对方吃进肚子里去才是目的。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,每一位用户与产品的交互都会留下可追溯的行为轨迹——电商用户的浏览、加购、下单,APP用户的注册、登录、功能使 ...
2026-03-31在日常数据统计、市场调研、学术分析等场景中,我们常常需要判断两个分类变量之间是否存在关联(如性别与消费偏好、产品类型与满 ...
2026-03-31在CDA(Certified Data Analyst)数据分析师的职场实战与认证考核中,“可解释性建模”是核心需求之一——企业决策中,不仅需要 ...
2026-03-31多层感知机(MLP,Multilayer Perceptron)作为深度学习中最基础、最经典的神经网络模型,其结构设计直接决定了模型的拟合能力、 ...
2026-03-30在TensorFlow深度学习实战中,数据集的加载与预处理是基础且关键的第一步。手动下载、解压、解析数据集不仅耗时费力,还容易出现 ...
2026-03-30在CDA(Certified Data Analyst)数据分析师的日常工作中,“无监督分组、挖掘数据内在聚类规律”是高频核心需求——电商场景中 ...
2026-03-30机器学习的本质,是让模型通过对数据的学习,自主挖掘规律、实现预测与决策,而这一过程的核心驱动力,并非单一参数的独立作用, ...
2026-03-27在SQL Server数据库操作中,日期时间处理是高频核心需求——无论是报表统计中的日期格式化、数据筛选时的日期类型匹配,还是业务 ...
2026-03-27在CDA(Certified Data Analyst)数据分析师的能力体系与职场实操中,高维数据处理是高频且核心的痛点——随着业务场景的复杂化 ...
2026-03-27在机器学习建模与数据分析实战中,特征维度爆炸、冗余信息干扰、模型泛化能力差是高频痛点。面对用户画像、企业经营、医疗检测、 ...
2026-03-26在这个数据无处不在的时代,数据分析能力已不再是数据从业者的专属技能,而是成为了职场人、管理者、创业者乃至个人发展的核心竞 ...
2026-03-26在CDA(Certified Data Analyst)数据分析师的能力体系中,线性回归是连接描述性统计与预测性分析的关键桥梁,也是CDA二级认证的 ...
2026-03-26在数据分析、市场研究、用户画像构建、学术研究等场景中,我们常常会遇到多维度、多指标的数据难题:比如调研用户消费行为时,收 ...
2026-03-25在流量红利见顶、获客成本持续攀升的当下,营销正从“广撒网”的经验主义,转向“精耕细作”的数据驱动主义。数据不再是营销的辅 ...
2026-03-25在CDA(Certified Data Analyst)数据分析师的全流程工作中,无论是前期的数据探索、影响因素排查,还是中期的特征筛选、模型搭 ...
2026-03-25在当下数据驱动决策的职场环境中,A/B测试早已成为互联网产品、运营、营销乃至产品迭代优化的核心手段,小到一个按钮的颜色、文 ...
2026-03-24在统计学数据分析中,尤其是分类数据的分析场景里,卡方检验和显著性检验是两个高频出现的概念,很多初学者甚至有一定统计基础的 ...
2026-03-24在CDA(Certified Data Analyst)数据分析师的日常业务分析与统计建模工作中,多组数据差异对比是高频且核心的分析场景。比如验 ...
2026-03-24日常用Excel做数据管理、台账维护、报表整理时,添加备注列是高频操作——用来标注异常、说明业务背景、记录处理进度、补充关键 ...
2026-03-23作为业内主流的自助式数据可视化工具,Tableau凭借拖拽式操作、强大的数据联动能力、灵活的仪表板搭建,成为数据分析师、业务人 ...
2026-03-23