前两篇文章介绍了几种常见的条形图,实际上看起来简单的条形图可探索的设置还有很多!在体育赛事中,经常出现一种对称条形图,比如对比两个热门选手或者队伍在各方面的打分情况等,这也是在普通横向条形图的基础上绘制出来的,作为无所不能的python,当然也是可以绘制这种图形的!
闲话少叙,直接上代码吧!
df = pd.read_excel(r"D:\data\football\曼城vs利物浦.xlsx") df
这是从英超历年球队积分的数据中截取出来的曼城和利物浦两支球队的数据,制作一个对称条形图,查看这两只球队在2010–2019年的积分表现。
这是原数据,单看表格对比不是很明显,来画一个对称条形图试试看:
plt.figure(figsize=(10,6)) ax = plt.gca() #获取坐标轴对象 ax.spines['right'].set_color('none') #把右边的边框颜色设置为无色,隐藏右边框 ax.spines['top'].set_color('none') #把上边的边框颜色设置为无色,隐藏上边框 ax.spines['bottom'].set_color('none') #把上边的边框颜色设置为无色,隐藏上边框 ax.yaxis.set_ticks_position('left') #指定左边的边为 y 轴 ax.spines['left'].set_position(('data', 0)) #指定 data 设置的left(也就是指定的y轴)绑定到x轴的0这个点上 plt.xticks([]) #去掉x轴刻度 plt.yticks(df.iloc[:,0].tolist()) #设置y轴刻度为年份 #绘制利物浦队的条形图,颜色用默认的蓝色 plt.barh(df.iloc[:,0],df.iloc[:,1], height=0.5,label = "利物浦") #绘制曼城队的条形图,需要在y轴的两侧显示条形,所以曼城队的数据取负数,设置颜色为粉色 plt.barh(df.iloc[:,0],-df.iloc[:,2],height=0.5,label = "曼城",color = "pink") #通过循环为曼城队的每个横向条形加标签,标签位置在对应条形的顶端,内容为球队当年的积分 for i,j in zip(range(len(df)),[2010,2011,2012,2013,2014,2015,2016,2017,2018,2019]): plt.text(-df.iloc[:,2][i]-5,j,df.iloc[:,2][i]) #通过循环为利物浦队的每个横向条形加标签,标签位置在对应条形的顶端,内容为球队当年的积分 for i,j in zip(range(len(df)),[2010,2011,2012,2013,2014,2015,2016,2017,2018,2019]): plt.text(df.iloc[:,1][i]+1,j,df.iloc[:,1][i]) plt.legend(loc = 4); #显示图例,loc参数指定图例位置在右下角
请看效果图:
是不是比看上边的表格要清晰和容易多了,一眼就能看出每一年两个球队的积分对比情况,整体看来曼城队是强于利物浦队的,至于那个异常的2019年数据,不是全年的数据,所以和其他年份数据差异很大。
对称条形图一般只能对比两个个体之间的各项指标数据,如果涉及多个个体,对称条形图就不怎么好用了。有另一种图可以同时展示多个个体的情况,就是发散型条形图!但是它本身也是有限制的,发散型条形图只能展示在某一个指标上多个个体的不同,而对称条形图是展示两个个体在多个指标上的对比,所以在实际应用中需要区分好需要实现的是什么。
到底是什么样的情况,我们还是直接上代码看图片吧:
df_yc = pd.read_excel(r"D:\data\football\球队排名比分2019.xlsx") df_yc.head(10) #查看前十条数据
这是英超2019年个球队的积分数据:
这是所有球队中在2019年积分排名前十的球队信息,绘图的时候所有球队的数据都会包含。
虽然发散型条形图形式和对称条形图类似,条形都是像两个互为相反的方向延申,然而两者还是有一些不同,对称条形图直接在其中一类数据直接取负数,而发散型条形图是在所有数据上都减掉了整体数据的均值,这样大于均值的数据依然为正,而低于均值的数据就会变成负数:
df_yc.积分.mean() #求所有球队的平均积分 df_yc.积分 = df_yc.积分 - df_yc.积分.mean() #所有球队的积分减掉均值 df_yc.sort_values("积分", inplace=True) #依据减掉均值后的积分进行升序排序 df_yc.head(10) #查看最新的前十条数据
由于条形图在绘制过程中是先从最下边开始画,我们希望最小的数值被画在最下边,由下到上升序排序,所以原数据要进行升序排序。
到这里其实什么都不用设置就可以直接出图了(做个心理建设,直接出的图有点丑):
plt.barh(y =df_yc.iloc[:,0],width=df_yc.iloc[:,1],height=0.3 ,color = colors,alpha=0.5);
是不是和曾经见过的发散型条形图长的差不多,除了丑一点。下边来进行一些完善,美化图形。
完善后的代码可就多了很多呢,具体如下:
plt.figure(figsize=(12,8)) #新建画布,尺寸为12*8 colors = [] #指定条形颜色 for i in df_yc.iloc[:,1]: if i > 0: colors.append("g") #超过均值的数值为绿色 else: colors.append("r") #低于均值的数值为红色 #绘制横向条形图,设置条形透明度为0.5,降低色彩饱和度,看起来更舒服一些 plt.barh(y =df_yc.iloc[:,0],width=df_yc.iloc[:,1],height=0.3 ,color = colors,alpha=0.5) pos = [] #指定要添加文本的x轴位置 for i in df_yc.iloc[:,1]: if i > 0: pos.append(i+0.5) #如果数值高于均值,文本在x轴的位置超过条形顶端0.5的距离 else: pos.append(i- 0.5)#如果数值低于均值,文本在x轴的位置小于条形顶端0.5的距离 for i in range(len(df_yc)): #通过循环为每个条形添加标签值 if pos[i] > 0: #plt.text(x轴方向位置,y轴方向位置,添加的文本信息) plt.text(x = pos[i]+0.5,y = i,s = round(df_yc.iloc[:,1].iloc[i],2)) else: plt.text(x = pos[i]-2,y = i,s = round(df_yc.iloc[:,1].iloc[i],2)) plt.title("2019英超各球队积分排名图(积分均值为30.25)") plt.grid(linestyle='--', alpha=0.5); #配置网格线
效果图:
是不是好看了很多,其实就是设置了画布大小,让整个图看起来不那么局促;然后控制条形的上下宽度,再加上标签方便查看每个条形的数据以及加了网格线,看起来就高大上了许多。
这个图很明显能看出英超球队积分参差不齐,没过均线的球队数量几乎是均线上球队数量的两倍,这也说明了好的球队特别好,把均线拉高了,差的球队数量很多,但是水平倒没有差的太离谱;整体来说还是好的球队更厉害,最好的超均线30分,最差的球队也只低于均线16分。
(本人一点都不懂足球,仅仅从2019年的数据中得到的一点点分析结果,之所以选择英超数据单纯的因为体育数据更容易得到一点而已,所以如果分析的不好,还请轻拍。)
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析在当今信息时代发挥着重要作用。单因素方差分析(One-Way ANOVA)是一种关键的统计方法,用于比较三个或更多独立样本组 ...
2025-04-25CDA持证人简介: 居瑜 ,CDA一级持证人国企财务经理,13年财务管理运营经验,在数据分析就业和实践经验方面有着丰富的积累和经 ...
2025-04-25在当今数字化时代,数据分析师的重要性与日俱增。但许多人在踏上这条职业道路时,往往充满疑惑: 如何成为一名数据分析师?成为 ...
2025-04-24以下的文章内容来源于刘静老师的专栏,如果您想阅读专栏《刘静:10大业务分析模型突破业务瓶颈》,点击下方链接 https://edu.cda ...
2025-04-23大咖简介: 刘凯,CDA大咖汇特邀讲师,DAMA中国分会理事,香港金管局特聘数据管理专家,拥有丰富的行业经验。本文将从数据要素 ...
2025-04-22CDA持证人简介 刘伟,美国 NAU 大学计算机信息技术硕士, CDA数据分析师三级持证人,现任职于江苏宝应农商银行数据治理岗。 学 ...
2025-04-21持证人简介:贺渲雯 ,CDA 数据分析师一级持证人,互联网行业数据分析师 今天我将为大家带来一个关于用户私域用户质量数据分析 ...
2025-04-18一、CDA持证人介绍 在数字化浪潮席卷商业领域的当下,数据分析已成为企业发展的关键驱动力。为助力大家深入了解数据分析在电商行 ...
2025-04-17CDA持证人简介:居瑜 ,CDA一级持证人,国企财务经理,13年财务管理运营经验,在数据分析实践方面积累了丰富的行业经验。 一、 ...
2025-04-16持证人简介: CDA持证人刘凌峰,CDA L1持证人,微软认证讲师(MCT)金山办公最有价值专家(KVP),工信部高级项目管理师,拥有 ...
2025-04-15持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。在实际生活中,我们可能会 ...
2025-04-14在 Python 编程学习与实践中,Anaconda 是一款极为重要的工具。它作为一个开源的 Python 发行版本,集成了众多常用的科学计算库 ...
2025-04-14随着大数据时代的深入发展,数据运营成为企业不可或缺的岗位之一。这个职位的核心是通过收集、整理和分析数据,帮助企业做出科 ...
2025-04-11持证人简介:CDA持证人黄葛英,ICF国际教练联盟认证教练,前字节跳动销售主管,拥有丰富的行业经验。 本次分享我将以教培行业为 ...
2025-04-11近日《2025中国城市长租市场发展蓝皮书》(下称《蓝皮书》)正式发布。《蓝皮书》指出,当前我国城市住房正经历从“增量扩张”向 ...
2025-04-10在数字化时代的浪潮中,数据已经成为企业决策和运营的核心。每一位客户,每一次交易,都承载着丰富的信息和价值。 如何在海量客 ...
2025-04-09数据是数字化的基础。随着工业4.0的推进,企业生产运作过程中的在线数据变得更加丰富;而互联网、新零售等C端应用的丰富多彩,产 ...
2025-04-094月7日,美国关税政策对全球金融市场的冲击仍在肆虐,周一亚市早盘,美股股指、原油期货、加密货币、贵金属等资产齐齐重挫,市场 ...
2025-04-08背景 3月26日,科技圈迎来一则重磅消息,苹果公司宣布向浙江大学捐赠 3000 万元人民币,用于支持编程教育。 这一举措并非偶然, ...
2025-04-07在当今数据驱动的时代,数据分析能力备受青睐,数据分析能力频繁出现在岗位需求的描述中,不分岗位的任职要求中,会特意标出“熟 ...
2025-04-03