京公网安备 11010802034615号
经营许可证编号:京B2-20210330
今天,大数据已无所不在,并且正被越来越广泛的被应用到历史、政治、科学、经济、商业甚至渗透到我们生活的方方面面中,获取的渠道也越来越便利。通过本系列的前面几篇文章,我们已经了解了数据可视化的必要性,而目前市面上也已经具备了非常多成熟的BI绘制工具,如Tableau,QlikView和魔镜等等。虽然这些工具正在变得越来越自动化,然而,随着大数据时代的来临,信息每天都在以爆炸式的速度增长,其复杂性也越来越高;其次,随着越来越多科学可视化的需求产生,地图、3D物理结构等技术将会被更加广泛的使用。所以,当人类的认知能力越发受到传统可视化形式的限制时,隐藏在大数据背后的价值就难以发挥出来,如果因为展示形式的限制导致数据的可读性和及时性降低,从而影响用户的理解和决策的快速实施,那么,数据可视化将失去其价值。
然而,所幸的是,技术的快速发展和不断变化的认知框架正在为人类打开新的视野,促使艺术与技术相结合而产生新型的数据可视化形式。

数据可视化的演变历史
一.为什么数据可视化形式亟待改进
我们每天都在说大数据,那数据到底能“大”到怎样的程度?也许你已经听说过以下结论:世界上90%的数据是在过去几年内产生的。事实上,过去三十年中,全世界的数据量大约每两年增加10倍,有专家估计,到2020年的时候,数据的年度产出量会达到4300%甚至更多,这已远远超出了著名的摩尔定律理论;所以,面临着这样的巨大挑战,大数据的时代的数据可视化给我们提出了以下要求:
1.以更细化的形式表达数据
首先,让我们来看一个相对简单的静态可视化图表:

图1.不安全流产率百分比估计(SciDev.Net 2016)
再来是一个更复杂的可视化图表:

图2.1986到2013年间172个国家的移动电话、固话和互联网的订购数量与容量(SciDev.Net 2015)
图1是一个数据量较少的静态可视化图表,我们可以通过4根柱状图的对比快速得到信息,而显而易见的,图2的数据量大大超出了图1,不仅有一百多个国家的数据变化,还包含不同的年份对比。更庞杂的数据量要求设计者通过更加细化的方式来呈现数据,所以我们可以看到图2以折线图为基础,结合了气泡的动态变化、语音说明,还包括让读者通过交互操作来选择展示哪些数据,才得以恰当和全面地展示这份数据,从而更完整的讲述一个故事。
2.以更全面的维度理解数据
“随着大数据技术成为我们生活的一部分,我们应该开始从一个比以前更大更去全面的角度来理解事物。”
这句话来自《大数据时代》,作者的原意是在大数据时代我们应该舍弃对数据精确性的要求,而去接受更全面但是也更混杂的数据,笔者认为它同样可以用来形容未来在数据可视化方面可以进步的方向。
众所周知,人类的视觉认知能力是有限的,类似下图这样的高密度可视化图形,虽然看似丰富和具有“艺术感”,可中间重叠连接的数据往往导致图形变得复杂和难以理解。

每个节点代表一个Wiki页面,每一根线代表页面之间的连接(维基百科链接结构可视化)
但是如果像下面这两个宇宙科普项目这样:你可以通过放大或缩小星系、调整视角、甚至像飞进了这些星球之间一样去观察它们,点击它们查看详细介绍等等……这样一个更”立体”的数据展示是否能更好的帮助你去理解这些信息呢?

通过交互式3D可视化展示探索宇宙中超过十万颗星球(100000 Stars)

通过手势识别设备来探索开普勒计划目前已确认的近2300个候选系外行星(视频地址)
如今,人们逐渐已不再满足于平面和静态的数据可视化视觉体验,而是越发想要“更深入”去理解一份数据,传统的数据可视化图表已不再是唯一的表现形式,现代媒介和技术的多样性,使人们感知数据的方式也更加多元。
3.以更美的方式呈现数据
艺术和数据可视化之间一直有着很深的联系,随着数据的指数级增长和技术的日趋成熟,一方面,用户们对可视化的美学标准提出越来越高的要求;另一方面,艺术家和设计师们也可以采用越来越创造性的方式来表现数据,使可视化更加具有冲击力。 纵观历史,随着人们接受并习惯了一种新的发明后,接下来就是对其进行一步步的优化和美化,以配合时代的要求, 数据可视化也是如此,因为它正在变得司空见惯,良好的阅读体验和视觉表现将成为其与竞品所区分的特征之一。

CNN ECOSPHERE项目将 “里约+20”地球峰会期间的Twitter话题汇集成星球上的一颗颗大树(视频地址)
在这里,笔者大概将其整理归纳为以下三点,当然它们并非都是必备特征:

三.典型应用场景
那么,这些运用新技术的数据可视化目前主要是在哪些场景和形式下使用呢?
1.大屏
首先,不得不提到的一定的是大屏了。什么是大屏?顾名思义,就是指通过整个超大尺寸的LED屏幕来展示关键数据内容。随着许多企业的数据积累和数据可视化的普及,大屏数据可视化需求正在逐步扩大,例如一些监控中心、指挥调度中心这样需要依据实时数据快速做出决策的场所,以及如企业展厅、展览中心之类以数据展示为主的展示场所,还有如电商平台在大促活动时对外公布实时销售数据来作为广告公关手段等等,而具体的展示形式又可能分为带触摸等交互式操作或只是作单向的信息展示等等。

双十一购物狂欢节采用实时数据大屏,带给观众更加准确、震撼和清晰的体验
2.触摸屏
作为实现交互式数据可视化的方式之一,触屏设备常常用作控制大屏展示内容的操作设备(其中也包括手机和平板),也可以兼顾显示和操作一体来单独展示数据,大大增加了用户与数据之间的互动程度。

将触摸屏与3D可视化相结合的微软黑科技(视频地址)
3.网页
目前应用于数据可视化方面的网页技术可以说是琳琅满目,如D3.js、Processing.js、Three.js、ECharts(来自百度EFE数据可视化团队)等等,这些工具都能很好的实现各类图表样式,而Three.js作为WebGL的一个第三方库则相对更侧重于3D方向的展示。

1992-2010年内世界小型武器和弹药的进出口贸易数据展示(armsglobe.chromeexperiments.com)
4.视频
有数据显示,人们的平均注意力集中时间已从2008年的12秒下降到2015年的8秒,这并不奇怪,当我们在面对越来越多的信息来源时,会自然倾向于选择更快捷的方法来获取信息,而人类作为视觉动物天生就容易被移动的物体吸引,所以视频也是数据可视化的有效展示手段之一,并且视频受到展示平台的限制更少,可以应用的场景也更广。不过因为其不可交互的特性,视频展示更适合将数据与更真实、更艺术的视觉效果相结合,预先编排成一个个引人入胜的故事向用户娓娓道来。

地球交通路线发展史(视频地址)
四.数据可视化的未来
可惜,仅有以上这些展示方式是不够的,人眼仅仅透过平面的屏幕来接收信息仍然存在着限制,VR、AR、MR、全息投影…这些当下最火热的技术已经被应用到游戏、房地产、教育等各行各业,可以预见的是数据可视化也能与这些技术擦出有趣的火花,比如带来更真实的感官体验和更接近现实的交互方式,使用户可以完全“沉浸”到数据之中。可以想象一下,当我们可以以360ᵒ全方位的角度去观看、控制、触摸这些数据时,这种冲击力自然比面对一个个仅仅配着冷冰冰的数字的柱状图要强得多。而在不远的未来,触觉、嗅觉甚至味觉,都可能成为我们接受数据和信息的感知方式。

DeathTools将新闻事件中抽象的死亡人数数据变成一具具尸体摆放在VR空间中,给用户更直观的冲击(视频地址)
结语
感谢技术的飞速发展带给了我们更多元的选择,使我们可以运用前所未有的创造性方式来展示数据, 但这并不意味着传统的数据可视化形式会逐渐消亡,毕竟这些新的展示技术和形式目前仍然面临着较高的制作成本,而传统的展示形式仍然是解决需要快速输出的可视化需求时的理想选择。数据可视化是一门同时结合了科学、设计和艺术的复杂学科,其核心意义始终在于清晰的叙述和艺术化的呈现,这些需要依靠数据分析师和设计师的精心策划而不是仅有炫酷的效果 ,最终达到帮助用户理解数据和做出决策的目标,才能发挥它巨大的价值和无限的潜力。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16