京公网安备 11010802034615号
经营许可证编号:京B2-20210330
想学数据分析?先来看看基础入门吧
谁说菜鸟不会数据分析的读书笔记,读完这本书的第一感觉是,excel已经够喝一壶了,不要急着想学SPSS、SAS,还是先从基础的看起吧。
做数据分析切忌为了分析而分析,要有明确的分析目的,一般会借助于一些理论模型来知道分析,比如:
营销方面的理论模型:4P、用户使用行为、STP理论、SWOT等,管理方面的理论模型:PEST、5W2H、时间管理、生命周期、逻辑树、金字塔、SMART原则。
书中列举的这些理论模型很多都听说过,只是平时处理问题很少用到,或者说没有人带着去切实的拿这些理论解决过实际问题,所以也就在平时很少想起了。不过在看这些方法的原理时,还是觉得蛮牛的。
数据收集常见的就是网络、数据库、调研等。
数据处理有数据清洗以去除垃圾数据,并且进行相应的转化计算。
后面花了很大的篇幅讲数据展现,还是比较全面的,见识了各种数据图表是如何做出来的。
其中讲了平均数、绝对数、百分数等几个以前小学学的概念,捡个现在用的比较多的说下:
倍数是一个数除以另一个数的商。
番数是指原来数量的2的N次方。N是几,就是现在的数据较原来的数据翻了几番。
以月为栗子来说明
2016年8月的数据较2015年8月的数据为同比。
2016年8月的数据较2016年7月的数据为环比。
书中有一个有意思的表格说明了方法论在数据分析中的位置:
作者用数据分析与服装师设计做类比,来说明方法论就像服装的设计图纸一样从整体上指导数据分析按照一定的规则体系完成,而不是抓到一块分析一块。
下面讲讲都有哪些方法论:
这个方法的名字其实就是四个分析因素的首字母缩写,分别是政治(political)、经济(economic)、技术(technological)和社会(social)。
一般用于从宏观层面分析企业或行业所处的环境。
也是英文首字母,何时(When)、何地(Where)、何人(Who)、何因(Why)、何事(What)、如何(How)、何价(How much)。
这个分析方法用途还是蛮大的,可以用于很多场景的分析,比如用户画像、用户的购买行为等等。
这个分析方法,如果你会用思维导图工具的话,一看就明白,其实就是将一个大问题一层层拆分成一个小问题,以便更好地分析问题,查找解决办法。
这个理论还真的是用于营销的,4P分别是产品(Product)、价格(Price)、促销(Promotion)、渠道(Place)。主要用于产品的营销分析。
强烈建议看到本文的小伙伴随便找一组数据在excel的“表格-条件格式”中的各种条件格式试一遍,你会发现,真的很好玩,原来一些看起来很炫酷的功能其实excel是可以轻松实现的。
挺实用的功能,用于多个不连续的空白单元格一次性填充相同内容。具体操作步骤如下:
1、按住ctrl不放,用鼠标左键一个个选中所有空白单元格。
2、选好后,放开ctrl,输入要填充的内容,这时,填充的内容会显示在最后一个选中的单元格中。
3、关键一步,按住ctrl不放,再按enter,这时,所有之前选中的单元格都会被填充上相同的内容。
函数比较难在博客中讲清楚,几个重要的函数,同学们可以自行百度一下具体用法:
取左部字符——left();
取右部字符——right();
字符合并——concatenate();
在表格的首列查找指定数据,并返回表格中需要的其他数据,用于两个表格匹配合并——vlookup();
跟上一个类似,是在表格的首行查找指定数据——hlookup();
年、月、日提取——date();
计算时间间隔长度,常用于工龄计算——dateif();
数据随机抽样——rand();
这也是比这之前一直很苦恼的一个问题,书中讲的方法不错,这里沿用书中的人才评价的例子说明:
如上表,将所有指标建立一个矩阵,一一进行对比重要性,行比列重要,交叉单元格写1,反之写0,比如人品对比动手能力,人品没有动手能力重要,则写0。注意,各指标不与自己做对比。
完成表格后,每一个指标都会有一个自己的得分,得分越高,权重越大:
某指标权重=(某指标重要性合计得分/所有指标的重要性合计得分)*100%
单独列出来,是因为这个excel的这个功能真的很好用,不过在博客也很难讲清楚,还请同学们自行百度一下,“数据透视表”,好用的不能再好用的功能。
书中这部分展示了各种炫酷的图表样式,适合浏览一下,以后用的上可以查阅,这里也做简单罗列:
柱状图、雷达图、条件格式(这个不是图形,是在第4点提到的功能,很强大,可以实现一些炫酷的效果,比如数据条、图标集、迷你图)、平均线图、双坐标图、竖形折线图、矩阵图、气泡图。
总体来看,这本书对我这种只会用excel最最基础功能的小白来说,还是蛮多惊喜的,至少有了一个全局观。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10