
由于不同的数据分析工具收集到的数据千差万别,基于这些数据生成展示的统计图表也不尽相同;而且数据分析师制作各种报告时,也常常纠结于如何选择合适的图表表达数据诉求,因此我们有必要去理解一些常用数据分析统计图表的特点、使用方法以及注意点。数据分析中主要使用以下几种图表。
折线图:按照时间序列分析数据的变化趋势时使用
柱 图:指定一个分析轴进行数据大小的比较时使用
饼 图:指定一个分析轴进行所占比例的比较时使用
仪表图:单独关注一个指标的绩效表现时使用
1.折线图
折线图主要是在按照时间序列分析指标值变化趋势的情况下使用。通常情况下X轴设定为时间,Y轴设定为其他指标值。分析页面浏览数,访问者数,转化数(率)等指标整体变化趋势时多用折线图。这些指标值用折线图表示之后,可以明确每小时段、天、周、月或年的变化趋势,得到类似“平时工作日的访问比较多,周末的访问比较少”,“这个月转化数较上个月下降了近10%”等分析结论。
那么接下来就让我们去见识一下网站分析所使用的几组折线图(X轴都设定为时间)。
首先,Y轴设定为页面浏览数的折线图。表示成折线图之后页面浏览数的增减就一目了然了。
(※折线图 ↓)
下图表示了同时涵盖“初次访问”和“再访问”的页面浏览数。在相同单位下这些指标值都可以统合在一个图表中显示。
(※细分折线图 ↓)
这样一来就可以细化分析一些趋势变化的原因。在上图中,可以发现:8月16日的流量短暂峰值主要来自于初访者。
接下来看下图。是【今年8月】和【去年8月】每一天的页面浏览数同比数据。可以看出今年不仅总体流量有所提升,而且有效缓解了每逢周末流量减少的现象。
(※对比折线图 ↓)
■做折线图时的注意事项
在做成折线图时请注意以下几点。
1. 图表中的指标要明示(即Y轴数值代表的指标)。
2. 当X轴有多于5个项目时推荐使用折线图,当不足5个项目时可以使用柱图。
3. 在一组折线图中如果折线超过了4条,由于折线之间有重复的部分所以会看不清楚。这种情况下,可以拆分成两组折线图去表现。
2.柱图
柱图主要是以特定的轴线来比较指标值的大小的情况下使用。柱图是网站分析中最常使用的一种图表。柱图可分为竖柱图、横柱图和累积竖柱图等。下面说明一下这几种柱图的特点。
首先是【横柱图】。横柱图也叫条形图,一般用来表示一类项目的横向对比,例如按访问量对网页的排名、按转化率大小对广告媒体的排名等。横柱图的X轴通常代表确定数值大小的刻度尺。下图是按访问量大小对网站页面的排名图:
(※横柱图 ↓)
其次是【竖柱图】。竖柱图和折线图用法类似,常用来表示时间序列的指标数值变化情况。不同的是,如果X轴上的时间点不多(例如低于5个)可以选择使用竖柱图;或者根据数据的性质和图表想要表达的侧重点来选择:竖柱图偏向于表现数量,而折线图偏向于表现趋势。
讲到这里还可以看出【竖柱图】表现的是数据随时间变化的关系,而【横柱图】所表示的项目对比指在某一时间点或时间段内的数据。也许有人会问“横柱图的数据不一样可以通过竖柱图表现出来吗?”,理论上可以,但通常横柱图中的项目名称(例如上例中的网页标题)都偏长,如果通过竖柱图表现很难在一行内展现,可能会出现折行的现象。
下图就是表现访问次数随时间变化的竖柱图。
(※竖柱图 ↓)
柱图中还有一种叫做【累积竖柱图】。当我们想确认某一个数值的详细内容时使用累积竖柱图就很方便了。下图是对访问次数按网站的访问来源(广告进入、直接访问进入、搜索引擎进入)细分做成图表,这样可以很容易的判断网站进入方式的详细情况。
(※累积竖柱图 ↓)
■做成柱图的注意事项
在做成柱图的时候请注意以下几点。
1. 注意竖柱图和横柱图的区分使用
2. 柱的数量过多导致柱间空隙很小时,可以选择使用折线图
3. 【数量】和【比例】最好做成不同的柱图
3. 饼图
饼图主要是在分析整体指标值中的成分比例时使用的。特点就是能够一眼分辨出哪一个项目所占的比例最大。下图中很容易的就能发现网站的进入页主要是“数码林的博客”页,比例将近达到了40%。
(※饼图 ↓)
■做成饼图时的注意事项
在做成饼图时请注意以下几点。
1. 由于饼图是为了确认比例而不是数量,所以饼图上表示的是比例,如果想要表现总数值的话,可以添加一行n=XXXX这样的描述。
2. 饼图中的构成元素是按照百分比降序排列的(【其他】除外)
3. 由于人们习惯顺时针看东西,所以最好把最重要的内容放在12点位置附近
4. 当饼图中的构成元素有10种以上时,排在后面的数据总结在一起用【其他】来表示。
4.仪表图
仪表图是为了关注单独一个指标的表现时使用。特点是能给出指标的安全范围和警戒范围。
例如将跳出率的表现以25%、50%为界限分为三个绩效区域,并分别以绿色、黄色和红色来区分三个绩效区域,其中红色表示警戒区域。从下图可以一眼看出9月的跳出率已经超过50%进入警戒区域,需要引起重视了。
(※仪表图 ↓)
■做成仪表图时的注意事项
在做成仪表图时请注意以下几点。
1. 注意绩效表现区域的划分,一般利用两个边缘值分为三个区域
2. 红色警戒区域出现在左侧还是右侧和指标的业务属性相关,例如跳出率越高越接近警戒区域,所以红色区域在右侧。
最后援引麦肯锡的《用图表说话》中一段话来总结一下关于图表的选择:
(1)图表是语言的一种形式,它的存在是为了比表格更快更好的表达你想要表达的内容
(2)决定图表的不是数据也不是尺寸,而是你想说明的主题
(3)图表贵精不贵多,只有当图表能帮你表达主题时才使用
(4)图表是直观教具,但它不能取代书写和讲述,在帮你传达主题时,它能起到重要作用
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
R 语言:数据科学与科研领域的核心工具及优势解析 一、引言 在数据驱动决策的时代,无论是科研人员验证实验假设(如前文中的 T ...
2025-09-08T 检验在假设检验中的应用与实践 一、引言 在科研数据分析、医学实验验证、经济指标对比等领域,常常需要判断 “样本间的差异是 ...
2025-09-08在商业竞争日益激烈的当下,“用数据说话” 已从企业的 “加分项” 变为 “生存必需”。然而,零散的数据分析无法持续为业务赋能 ...
2025-09-08随机森林算法的核心特点:原理、优势与应用解析 在机器学习领域,随机森林(Random Forest)作为集成学习(Ensemble Learning) ...
2025-09-05Excel 区域名定义:从基础到进阶的高效应用指南 在 Excel 数据处理中,频繁引用单元格区域(如A2:A100、B3:D20)不仅容易出错, ...
2025-09-05CDA 数据分析师:以六大分析方法构建数据驱动业务的核心能力 在数据驱动决策成为企业共识的当下,CDA(Certified Data Analyst) ...
2025-09-05SQL 日期截取:从基础方法到业务实战的全维度解析 在数据处理与业务分析中,日期数据是连接 “业务行为” 与 “时间维度” 的核 ...
2025-09-04在卷积神经网络(CNN)的发展历程中,解决 “梯度消失”“特征复用不足”“模型参数冗余” 一直是核心命题。2017 年提出的密集连 ...
2025-09-04CDA 数据分析师:驾驭数据范式,释放数据价值 在数字化转型浪潮席卷全球的当下,数据已成为企业核心生产要素。而 CDA(Certified ...
2025-09-04K-Means 聚类:无监督学习中数据分群的核心算法 在数据分析领域,当我们面对海量无标签数据(如用户行为记录、商品属性数据、图 ...
2025-09-03特征值、特征向量与主成分:数据降维背后的线性代数逻辑 在机器学习、数据分析与信号处理领域,“降维” 是破解高维数据复杂性的 ...
2025-09-03CDA 数据分析师与数据分析:解锁数据价值的关键 在数字经济高速发展的今天,数据已成为企业核心资产与社会发展的重要驱动力。无 ...
2025-09-03解析 loss.backward ():深度学习中梯度汇总与同步的自动触发核心 在深度学习模型训练流程中,loss.backward()是连接 “前向计算 ...
2025-09-02要解答 “画 K-S 图时横轴是等距还是等频” 的问题,需先明确 K-S 图的核心用途(检验样本分布与理论分布的一致性),再结合横轴 ...
2025-09-02CDA 数据分析师:助力企业破解数据需求与数据分析需求难题 在数字化浪潮席卷全球的当下,数据已成为企业核心战略资产。无论是市 ...
2025-09-02Power BI 度量值实战:基于每月收入与税金占比计算累计税金分摊金额 在企业财务分析中,税金分摊是成本核算与利润统计的核心环节 ...
2025-09-01巧用 ALTER TABLE rent ADD INDEX:租房系统数据库性能优化实践 在租房管理系统中,rent表是核心业务表之一,通常存储租赁订单信 ...
2025-09-01CDA 数据分析师:企业数字化转型的核心引擎 —— 从能力落地到价值跃迁 当数字化转型从 “选择题” 变为企业生存的 “必答题”, ...
2025-09-01数据清洗工具全景指南:从入门到进阶的实操路径 在数据驱动决策的链条中,“数据清洗” 是决定后续分析与建模有效性的 “第一道 ...
2025-08-29机器学习中的参数优化:以预测结果为核心的闭环调优路径 在机器学习模型落地中,“参数” 是连接 “数据” 与 “预测结果” 的关 ...
2025-08-29