京公网安备 11010802034615号
经营许可证编号:京B2-20210330
最近一段时间以来,围绕大数据可视化所展开的讨论可谓层出不穷——其话题之丰富、交锋之激烈甚至不亚于大数据技术本身。目前业界普遍认为可视化是最优秀的(或者说是惟一一种)数据内容表达方式,甚至如果不对数据进行可视化处理,我们将错失大量宝贵信息。
可视化是获取并分享观点的绝佳途径,但很多大数据团队却没能选对正确的方式。可视化怎么会出现问题?原因很简单,因为存在多种可能破坏数据可视化效果的实施方式。下面我们就一同来探讨最为常见的三种错误实践。
错误一:显示所有数据
尽管我们在学校里被告知表达意见应当尽全面,但事实上大多数人根本不在乎我们实际做过多少工作,他们不关心我们每天处理了多少数据或者Hadoop集群的规模到底有多大。客户与内部用户需要的是具体且紧紧围绕核心问题的答案,而且最好能让他们尽早得到这些答案。我们的答案与他们的需求关联越是紧密,他们在寻找答案方面所投入的精力也就越少。请千万记住,页面上显示的无关数据越多、找出正确结论与相关信息就变得越困难;无论出于什么样的理由,无关数据就是分散注意力、浪费时间资源的干扰因素。
这类干扰因素在信息面板当中显得特别普遍,因为这类面板的指导理念往往是“显示所有状态”。但事实上其中大部分状态都是正常、乏味、甚至不值一提的,因此把这些没问题的内容显示出来很可能导致相关人员因为视觉疲劳而忽略了真正异常的状况。
出色的信息面板方案应该只显示那些值得关注或者重要性较高的内容。优先显示重要信息、而后是意外信息、接下来是可操作性信息,其它内容则都应该尽可能淡化。深入挖掘数据信息当然也很重要,不过信息面板并不是处理这项工作的舞台。对于信息挖掘工作,报告等包含广泛非可操作性数据的表达载体更为适合。
错误二:信息关联性不好、复杂性过高
这种错误的危险性绝不逊于第一条。显示全部信息子集当然不错,但前提是数据的关联性必须得到保证。举例来说,如果大家关注销售情况,那么同时也可能希望了解各个地区的销售走势或者其随时间推移而发生的变化。首先考虑到用户对数据的使用方式,而后才能作出正确决策。
将所有信息都塞进同一套图表当中很可能不足以概括整体情况,相比之下制作多份紧密关联的图表才是最理想的处理方式。一般来说,多份简洁而清晰的图表在实际表现方面要优于单一且高度复杂的数据可视化成果。
错误三:糟糕的数据表现形式
即使我们在绘制图形时使用的数据完全正确,得到的结果也仍然无法保证有效。结合实际体验,大家会发现日常工作中很少见到某些奇特的图形设计——这是因为它们的效果并不好。在满足可视化需求方面,绝大部分优秀的案例都会相对保守地使用样形图、折线图、散点图以及饼状图(其中饼状图的制作难度更大一些)。
我们需要思考不同数据字段之间的核心关联,并想办法将这些字段铺设在坐标轴之上。接下来,按照类型进行分组,并以时间、幅度或者重要性为依据对数据加以排序。(如果这些排序方式都不合适,按照首字母或者拼音排序也是可行的。)另外,请务必用颜色来标记不同类别(而不要用大小);大家可以利用不同亮度或者色彩饱和程度来说明大小。再有,请使用标签及其它标记有选择地引导阅读者的注意力,同时又不至于扰乱正常查看。
良好的设计
思考与规划优先要规避上述错误,最好的办法就是首先专注于我们想要表达的核心目标。在考虑可视化方案的直观效果之前,请大家依次回答以下几个问题:
1. 我们需要采取哪些行动(或者我们关注什么样的重点)?
2. 我们需要传达怎样的决定(我们又将如何将其付诸实施)?
3. 我们需要提出怎样的问题?
4. 我们需要看到哪些数据?
5. 我们要选择什么样的最佳结构来准确提示数据内容之间的重要关系?
6. 我们需要突出显示哪些数据信息?
在大家回答了上述问题之后,就可以开始着手设计并利用正确的数据来实施理想的可视化方案了。当然,在处理过程中我们可能还需要作出各种调整。调整并不是坏事,我们可以利用迭代、测试、测试不同的实现方法而后再次迭代的方式来找到最佳选项。只有经过深思熟虑且坚持面向用户的设计方案才能打造出切实有效且更富效率的数据可视化成果。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【专访摘要】本次CDA持证专访邀请到拥有丰富物流供应链数据分析经验的赖尧,他结合自身在京东、华莱士、兰格赛等企业的从业经历 ...
2026-05-12在手游行业存量竞争日趋激烈、流量成本持续高企的当下,“拉新”早已不是行业核心痛点,“留存”尤其是“付费留存”,成为决定手 ...
2026-05-12 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-05-12用户调研是企业洞察客户需求、优化产品服务、制定运营策略的核心前提,而调研数据的可靠性,直接决定了决策的科学性与有效性。在 ...
2026-05-11在市场竞争日趋激烈、流量成本持续攀升的今天,企业的核心竞争力已从“获取流量”转向“挖掘客户价值”。客户作为企业最宝贵的资 ...
2026-05-11 很多数据分析师精通Excel单元格操作,熟练应用多种公式,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质 ...
2026-05-11在互联网运营、产品优化、用户增长等领域,次日留存率是衡量产品价值、用户粘性与运营效果的核心指标,更是判断新用户是否认可产 ...
2026-05-09相关性分析是数据分析领域中用于探究两个或多个变量之间关联强度与方向的核心方法,广泛应用于科研探索、商业决策、医疗研究、社 ...
2026-05-09 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-05-09在数据驱动运营的时代,指标是连接业务目标与实际行动的核心桥梁,是企业解读业务现状、发现问题、预判趋势的“量化标尺”。一套 ...
2026-05-08在存量竞争日趋激烈的商业时代,“以客户为中心”早已从口号落地为企业运营的核心逻辑。而客户画像作为打通“了解客户”与“服务 ...
2026-05-08 很多数据分析师每天与Excel打交道,但当被问到“什么是表格结构数据”“它和表结构数据有什么区别”“表格结构数据有哪些核 ...
2026-05-08在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07在数据分析、计量研究等场景中,回归分析是探究变量间量化关系的核心方法,无论是简单的一元线性回归,还是复杂的多元线性回归、 ...
2026-05-07 很多数据分析师画过趋势图、做过业绩预测,但当被问到“这个月销售额增长20%,到底是长期趋势自然增长,还是促销活动的短期 ...
2026-05-07在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30