京公网安备 11010802034615号
经营许可证编号:京B2-20210330
CDA数据分析师 出品
近日,新冠肺炎防控成果的好消息不断。
今天我们聊聊,惊艳的疫情直观图。
据国家卫健委数据统计, 截止至3月10日24时,31省区市累计治愈出院病历超6万,达到61475例。
3月10日,随着江夏方舱医院和武昌方舱医院“休舱大吉”,武汉14家方舱医院全部休舱。
截止到3月12日24时,全国13地连续16天及以上无新增新冠肺炎确诊病例。
看来春天真的是来了,疫情好转的势头已经愈发明显。想必许多小伙伴也一样,越来越期待摘下口罩的那天,出门玩耍,出游踏青,吃起火锅唱起歌。
不过C君在这里也要提醒大家,多地病历0新增不代表零风险,一定要绷住,不要过早的松懈!继续戴好口罩,做好个人防护,避免人群聚集,相信摘下口罩的那天也就不远啦!
与此同时,最近刷遍微博的这个疫情直观图火了!来自央视新闻官微的这个图一经发出就令人惊艳,彩虹的配色,直观的展现出目前全国多地病例0新增的数据。
一时间#这道彩虹真赞#的话题在微博上阅读达到2.6亿,讨论3.4万。大家在欣喜疫情好转的同时,都在问这个图叫什么呀?真太惊艳了。
微博上也出现了各种解答,有的说是饼图,扇形图,甚至还有的说是蜗牛图,漩涡图的…其实准确的来说,这个图叫做南丁格尔玫瑰图。
南丁格尔玫瑰图(Nightingale rose diagram)又名鸡冠花图、极坐标区域图。统计学家和医学改革家佛罗伦斯‧南丁格尔 (Florence Nightingale) 曾在克里米亚战争期间使用这种图表传达士兵身亡情况,故得名。
说起南丁格尔玫瑰图,就不得不聊一聊它的发明者,世界上第一个真正的女护士——弗罗伦斯·南丁格尔。
弗罗伦斯·南丁格尔是著名的英国护士和统计学家,于1820年5月12日出生于意大利一个来自英国上流社会的家庭。南丁格尔在德国学习护理后,曾往伦敦的医院工作。于1853年成为伦敦慈善医院的护士长。
19世纪50年代,英国、法国、土耳其和俄国进行了克里米亚战争,当时英国战士的死亡率高达42%。南丁格尔主动申请,她和38名女性志愿者护士的工作人员,前往战地医院服务。
到达战地医院后,南丁格尔克服种种困难,改善医院后勤服务和环境卫生,建立医院管理制度,提高护理质量,使伤病员死亡率从42%,急剧下降到2%。同时南丁格尔不仅表现出非凡的组织才能,而且对伤病员的关怀爱护感人至深。因此她也被称为被称为“克里米亚的天使”;南丁格尔经常在黑夜中提灯巡视病房,又被誉为“提灯女士”(The Lady with the Lamp)。
由于南丁格尔的贡献,让昔日地位低微的护士,社会地位与形象都大为提高,成为崇高的象征。“南丁格尔”也成为护士精神的代名词。
除了出色的医护才能,南丁格尔也有很强的数学天分,这也让她在之后成为视觉表现和统计图形的先驱。
在克里米亚的战地医院工作时,她分析过堆积如山的军事档案,发现在克里米亚战役中,英军死亡的原因是在战场外感染疾病,及在战场上受伤后缺乏适当护理而伤重致死,真正死在战场上的人反而不多。
由于当时资料统计的结果往往不受人重视,她发展出一种色彩缤纷的图表形式——南丁格尔玫瑰图,让数据能够更加让人印象深刻。她用这个图标来表达军医院季节性的死亡率,向不会阅读统计报告的国会议员,报告克里米亚战争的医疗条件。
左下说明简译
正是这种清晰易懂的数据展现形式,改变了当时包括维多利亚女王在内的高层人士的认知,导致他们做出医事改革的决策。
普通柱形图的坐标系是直角坐标系,而南丁格尔玫瑰图的坐标系是极坐标系,使用圆弧的半径长短表示数据的大小。比起一般的柱状图,它要更有冲击性,是非常一目了然的统计图。
那南丁格尔玫瑰图都有哪些用例呢?
除了对比不同分类的大小,如各国制造指数的对比:
Facebook 和 Twitter的用户对比:
还可以用于表示披头士歌曲的音调。
还有最近火了的全国各地0新增彩虹图。
那么你想知道,怎么才能做出如此惊艳的南丁格尔玫瑰图吗?
常见的方法有用Excel,然而做起来过程繁琐还还原度低。
要知道,万物皆可Python。
除了用Excel,今天C君就来教教你,怎么用Python做南丁格尔玫瑰图,保证高还原度:
左图是原图,右图是用pyechart做的。
具体步骤如下:
我们使用pyecharts包进行南丁格尔玫瑰图的绘制,如果你没有安装pyecharts,可以使用以下代码进行pip安装。
pip install pyecharts
南丁格尔玫瑰图和饼图类似,算是饼图的一种变形,用法也一样,主要用在需要查看占比的场景中。
首先需要导入我们需要使用的包,其中pandas用于数据整理,pyecharts用于绘图。
import pandas as pd
from pyecharts.charts import Pie
from pyecharts import options as opts
然后准备需要的数据,所用信息来自于国家卫健委官方网站,整理之后的数据使用列表的形式进行存储,其中provinces存储省份名称,num存储确诊病例连续多日零新增的数字,color_series列表存储颜色用于后续的绘图使用。
provinces = ['北京','上海','黑龙江','吉林','辽宁','内蒙古','新疆','西藏','青海','四川','云南','陕西','重庆',
'贵州','广西','海南','澳门','湖南','江西','福建','安徽','浙江','江苏','宁夏','山西','河北','天津']
num = [1,1,1,17,9,22,23,42,35,7,20,21,16,24,16,21,37,12,13,14,13,7,22,8,16,13,13]
color_series = ['#FAE927','#E9E416','#C9DA36','#9ECB3C','#6DBC49',
'#37B44E','#3DBA78','#14ADCF','#209AC9','#1E91CA',
'#2C6BA0','#2B55A1','#2D3D8E','#44388E','#6A368B'
'#7D3990','#A63F98','#C31C88','#D52178','#D5225B',
'#D02C2A','#D44C2D','#F57A34','#FA8F2F','#D99D21',
'#CF7B25','#CF7B25','#CF7B25']
接下来使用pandas对数据进行降序排列以方便后续的绘图,并提取数据。
# 创建数据框
df = pd.DataFrame({'provinces': provinces, 'num': num})
# 降序排序
df.sort_values(by='num', ascending=False, inplace=True)
# 提取数据
v = df['provinces'].values.tolist
d = df['num'].values.tolist
最后使用Pyecharts库中的Pie类进行图形的绘制,代码说明如下,其中的配置项可以在pyecharts官网 https://pyecharts.org
进行查看。图形生成在本地的html网页中。
# 实例化Pie类
pie1 = Pie(init_opts=opts.InitOpts(width='1350px', height='750px'))
# 设置颜色
pie1.set_colors(color_series)
# 添加数据,设置饼图的半径,是否展示成南丁格尔图
pie1.add("", [list(z) for z in zip(v, d)],
radius=["30%", "135%"],
center=["50%", "65%"],
rosetype="area"
)
# 设置全局配置项
pie1.set_global_opts(title_opts=opts.TitleOpts(title='玫瑰图示例'),
legend_opts=opts.LegendOpts(is_show=False),
toolbox_opts=opts.ToolboxOpts)
# 设置系列配置项
pie1.set_series_opts(label_opts=opts.LabelOpts(is_show=True, position="inside", font_size=12,
formatter="{b}:{c}天", font_,
font_weight="bold", font_family="Microsoft YaHei"
),
)
# 生成html文档
pie1.render('南丁格尔玫瑰图.html')
生成的图如下:
最后,再自己加一下中间的字就大功告成,对比一下原图,是不是还原度很高呢?
结语:
怎么样,用Python作出如此绚烂的彩虹玫瑰图,你学会了吗?绚烂玫瑰,意味着我们终将完全战胜疫情,大家又可以开始丰富多彩的社会生活。
不过C君还是要提醒大家一下,虽然目前疫情大有转好,但大家一定不能掉以轻心!坚持做好防护哦,直到疫情完全解除的那一天。奥利给!
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15