CDA数据分析师 出品
编译:Mika
我们不断在创造着大量的数据。据估计,仅在2020年我们就产生了惊人的59泽字节的数据。
随着如此多的信息四处传播,数据分析已经成为一个不可或缺的专业领域,这并不令人惊讶。
而这其中的一个关键部分就是数据可视化。
用图表表示数据,能够使我们发现新的见解,进行高层次的分析,并以清晰、简洁的方式传达我们的发现,同时这还是一种艺术形式。
在本文中,我们将列举出2021年度那些令人惊艳的可视化作品与你分享。
如前所述,人类在2020年创造了大约59泽字节的数据。要知道,人类在2010年代中期创造的数据才达到1泽字节,这是一个令人难以置信的数量。随着世界范围内数字化连接趋势越来于强,我们的数据生产速度只会更快。
1泽字节相当于六亿个字节,到底是个什么概念呢?不妨看看下图。
(来源:The Guardian / Cisco)
上述可视化无疑使我们更容易理解1泽字节到底有多么庞大,这就是数据可视化的力量。
随着我们产生的数据量不断增长,需要更复杂的可视化技术来理解它。一种越来越流行的数据形式是网络图,这让我们绘制许多不同点或节点之间的关系。对于描绘可视化中出现的连接或群体,网络图是非常不错的选择。
(来源: Kirill Benzi )
这个醒目的网络图不仅仅是一张漂亮的图片。它追踪了《星球大战》宇宙中的2万多个角色之间的联系。每个角色都由一个节点代表。
其中红色代表力量的黑暗面;蓝色代表光明面;黄色表示罪犯和赏金猎人。总共有超过66,000个连接,这恰恰显示了网络图可以有多么强大。
随着智能手机能追踪人们的行动,标记位置的数据正迅速成为一种普遍现象。这在新冠疫情期间被证明特别重要,因为各国争先恐后地跟踪和追查潜在的感染链。在这个例子中,数据可视化软件供应商Tectonix向我们展示了特定位置数据地图的潜力。
(来源:YouTube / Tectonix GEO )
这个可视化图显示了2020年春假期间在佛罗里达州收集的手机定位数据。每个手机信号都由一个红色节点代表。红色节点表示有很多人在享受春假。蓝色强调的区域是劳德代尔堡的一个海滩。
(来源:New York Times / Tectonix GEO )
通过追踪该海滩上的每个节点,Tectonix显示了春假结束时个人旅行的确切地点。因此,我们可以很容易地看到来自该海滩的个人可能已经传播新冠疫情的距离和范围。
虽然有些可视化使用3D元素来增加一点亮点,但最好的可视化是充分地利用三维空间。位于英国的数据分析公司Automatic Knowledge Ltd.的创始人Alasdair Rae在这一可视化过程中完美地说明了这一点。
(来源:Alisdair Rae / statsmapsnpix.com )
利用欧盟免费提供的GHS_POP数据,这些图片显示了整个欧洲的人口密度。该地图被分解成1公里×1公里的方块,条形高度代表了生活在每个地区的人口数量。除了提供引人注目的效果图外,我们还可以一目了然地看到哪里是人口最密集的地区。例如,巴黎、伦敦、马德里和罗马都脱颖而出。
如果没有与数据分析相关的主题,那么这篇文章是不完整的。
考虑到这一点,下面这个图表就通过气泡图和循环网络图显示了在CRAN上300个包中使用的流行编程语言。
(来源: Dr Torsten Sprenger / GitHub )
通过从TIOBE指数(衡量编程语言的流行程度)中获得的数据,这个可视化显示了哪些CRAN软件包是用哪些语言创建的。其中R排在首位,其次是C和C++。不太流行的语言用小圆圈表示。每个圆圈的大小与制作软件包所用的代码行数成正比。
好的数据可视化不需要太过华丽。
如果数据可能被用来帮助政府政策或决策,那么表述清晰是至关重要的。而折线图就是能清晰、简单地绘制时间序列数据的一个优秀工具。
(来源:UNEP GRID )
这张线图追踪了从1880年到2010年代末的全球表面温度。重要的是,它包括来自四个不同来源的数据。NASA、NOAA、日本气象局和MetOffice。通过叠加这四个来源的数据,不难注意到当中的密切相关性,它们均显示了在过去200年里全球表面温度在不断上升。
可视化不应该为了互动而互动。然而,互动性也可以改变我们看待数据的方式。Gov | DNA是一个获奖的在线互动网络工具,探讨了世界各国政府数据。
(来源:Werner Helmich )
该工具将每个国家表现为一个气泡,让你通过点击按钮来比较不同的国家。例如,你可以根据就业、预期寿命、新闻自由和腐败等变量追踪每个国家的世界幸福指数。
流图是一种面积图,通常用于比较时间序列数据。虽然并不总是适合进行深入分析,但它们非常适合提供广泛的概述。
(来源:Talia Bronshtein / insightfulinteraction.com )
由数据记者Talia Bronshtein创作的这幅美丽的流程图描绘了200多年(1820年至2015年)来美国不同移民的国籍。
从中,我们可以看到,在二战期间(1939-1945年),美国的移民几乎停止了。还可以看到,二战前的大多数移民来自奥匈帝国、意大利和俄罗斯等国;到21世纪末,大部分移民来自亚洲和南美国家。
数据可视化不仅仅是用于数据分析,可以是一种艺术形式。
2010年,艺术家Janet Echelman被委托创作一个图,代表西半球35个国家的相互联系。那一年,智利发生了大地震。这一事件的震级如此之大,以至于引发了一场巨大的海啸,使地球的一天缩短了1.26微秒。
(来源:NOAA / PMEL / Center for Tsunami Research )
这张图片显示了由美国国家海洋和大气管理局(NOAA)模拟的地震引起的海啸的热图。Janet Echelman以此为灵感创作了她的雕塑,她用不同颜色的绳子悬挂在一个轻巧的框架上。
(来源:Janet Echelman )
随后的雕塑名为1.26,这也证明了据分析可以和任何艺术领域一样具有创造性。
2021,知名大数据网站FiveThirtyEight用精美的数据可视化讲述了关于新冠疫情、政治局势和体育界的故事。
这里我们列举了当中一些非常惊艳的可视化作品分享给大家。
新冠
美国不愿意接种疫苗人群数据
大多数未接种疫苗的美国人认为疫苗的风险比感染新冠更大
白人孩子最不害怕新冠
政治
加州的罢免程序比大多数州都容易
通货膨胀率上升给美国总统的支持率带来影响
重新划分选区的最新情况
科学
美国大型城市引领可再生能源的发展
美国各地的高温,西部地区的火灾和干旱情况
15年调整平均值和记录的大西洋盆地飓风数据,1851-2019
东京奥运会
没有人能接近博尔特最佳时期的成绩
奥林匹克运动会竞赛项目年表1896-2020年
轮椅运动员在长跑中更能展现出优势
体育
世界象棋桂冠争夺赛
更快并不一定意味着更好
金州勇士队保持明星阵容
Matt Araiza的赛场罚球数据
LeBron James三分球数据
Patrick Mahomes 轻松投出长球
参考链接:
https://careerfoundry.com/en/blog/data-analytics/data-visualization-examples/
https://fivethirtyeight.com/features/our-51-best-and-weirdest-charts-of-2021/
数据分析咨询请扫描二维码
CDA数据分析师在中国航信高科技产业园进行了面向测试度量的数据分析培训课程,培训人数近2 ...
2024-05-01CDA数据分析师走进深圳迈瑞生物医疗电子股份有限公司,在迈瑞总部展开了为期两天的培训,本次课程参训人员线上及线下近百人, ...
2024-05-01CDA数据分析师在合肥市对合肥阳光新能源科技有限公司开展了为期8天的企业内训。 合肥阳光新能源科技 ...
2024-05-01CDA数据分析师走进海尔大学,进行了《数据治理与数据中台建设的道与术》专题培训,培训现场爆满,近百人参加了此次培训。 ...
2024-05-01在中国银行苏州分行培训中心开始数据分析师培训,此次培训课程共10天内容,包括Excel、MySQL、概率论与数理统计、SPSS等内容, ...
2024-05-01从实际的业务需求出发,结合行业的典型应用特点,围绕实际的商业问题,探讨数据挖掘、机器学习模型在金融领域的应用,包括获客、信用评分、细分画像、交叉销售、反欺诈、违规识别、时序预测、运筹优化、流程挖掘九个方面,形成 ...
2024-05-01本次培训课程为线上+线下的模式,由于学员编程能力不一、部分学员没有编程基础,故提供统计学、python基 ...
2024-05-01华夏银行信用卡中心-机器学习培训 1、课程亮点 取材于业界一流企业和顶级咨询公司的行业实践;已经被证明是人人 ...
2024-05-01主 题:数据中台建设及数据分析应用主题分享 1. 数据中台市场洞察 2. 主流数据中台产品比较 3. 某企业数据中 ...
2024-05-01围绕“数据驱动”战略,全力打造我行 300 人数字化人才梯队,着力培养数字化管理人才、大数据专业团队 ...
2024-05-01在当今数据驱动的商业环境中,数据分析成为了企业决策的重要依据。通过对大量数据的收集、处理和分析,企业能够更好地理解市场 ...
2024-04-29在人工智能(AI)的世界里,提示词(Prompt)是一种强大的工具,它能够引导AI按照用户的需求产生特定的输出。本文将深入探讨AI ...
2024-04-29CDA立足未来职场,拓展前沿视野——对外经贸大学保险学院举办“三全育人大讲堂”分享行业最新动态。 ...
2024-04-294月2日,CDA数据分析师创始发起人兼协会理事长赵坚毅博士受邀在浙江万里学院举办了一场以“数字化能力在职场中的作用” ...
2024-04-29随机森林(Random Forests)现在机器学习中比较火的一个算法,是一种基于Bagging的集成学习方法,能够很好地处理分类和回归的问 ...
2022-12-23方差分析是数据分析中常用的一种统计分析方法,接下来让我们简单了解一下方差分析的基本思想和原理吧。 方差分析(Analysis ...
2022-12-23来源:关于数据分析与可视化 关于streamlit-aggrid 数据排序 表格样式的调整 数据 ...
2022-08-03作者:麦叔 定义 「把上面晦涩的概念汇成一句话就是:」 ❝ 回调函数就是一个被作为参 ...
2022-08-03现今,高学历人群日益增多,物以稀为贵的高学历光环淡去。无论本科生还是研究生,甚至博士生,求职竞争力都大不如前,就业压力越来越大。
2022-06-01某家企业10个人面试,有9个本科生……如何脱颖而出,除得体的举止和良好的沟通力外,证书成重要筹码,这也是很多人考证的关键所在。
2022-04-14