cxm272965

2020-07-20   阅读量: 1441

数据分析师 python

Python可视化库——Matplotlib和Seaborn库

扫码加入数据分析学习群

数据可视化库——Matplotlib

import matplotlib.pyplot as plt

1

默认可视化操作

plt.plot():画图

plt.show():显示

设置参数

plt.xticks(rotation):变量名倾斜

plt.xlable(‘变量名’):x轴名称

plt.ylabel(‘变量名’):y轴名称

plt.title():标题名称

子图

fig=plt.figure():指定默认画图空间

fig.add_subplot(4,1,x):x代表相对位置

加注释:plt.legend(loc=‘best’) 'best’代表注释框的位置

绘图种类:fig,ax=plt.subplots(),ax是画图的轴,实际画图;fig用来设置参数

柱形图:

ax.bar(bar_positions, bar_heights, 0.5),0.5代表柱宽

ax.barh():橫柱形图

散点图:ax.scatter(x, y)

直方图(有bins):

ax.hist(y, range(4,5), bins=20),range设置了值的范围

ax.set_ylim(0.5):设置y轴范围

盒图:ax.boxplot()

在某元素上加文字:ax.text(x, y, ‘text’)

可视化库——Seaborn

import seaborn as sns

1

Seaborn库是在Matplotlib库基础上的封装

设置风格

sns.set():默认风格

sns.set_style(“风格”):5种风格

with sns.axes_style(“风格”):with下的语句全部使用这种风格

布局

sns.despline(offset, left):设置轴线的偏置及显示

sns.set_context(“paper”):设置图中曲线大小

调色板:sns.color_palette(),共有6个主题

圆形画板:sns.color_palette(“hls”)

成对:“Paired”

连续型

sns.color_palette(“Blues”):由浅到深

sns.color_palette(“Blues_r”):由深到浅

sns.light_palette(“green”):由浅到深,reverse=True表示由深到浅

sns.dark_palette(“green”):由深到浅

线型:sns.cubehelix_palette(8, start, rot)

变量分析

单变量:sns.distplot(x, kde, bins, fit)——直方图

x:变量

kdn:估计和密度

bins:将x轴分为几份

fit:分布状态

双变量:

sns.jointplot(x, y, data)——散点图

sns.jointplot(x, y, kind=“hex”, color)——可体现数据密度

多变量

sns.pairplot():体现两两变量之间的关系

sns.stripplot(x, y, data):不推荐,数据量大时连成一条线

优化方法:

sns.stripplot(x, y, data, jitter=True)——加小幅度的抖动

sns.swamplot(x, y, data)——树状

sns.violinplot(x, y, hue, data, split)——小提琴图

回归分析:regplot,lmplot

sns.load_dataset(“数据”)——下载数据

sns.regplot(x, y, data, jitter)

分类分析

sns.barplot(x, y, hue, data):条形图,描绘整体趋势

sns.pointplot(x, y, hue, data):点图,描绘变化差异

sns.factorplot(x, y, data, kind):多层面板分类图

Facetgrid——展示子集

使用方法

g=sns.FacetGrid(data, col)

g.map(plt.hist, “变量”)

设置参数

g.set_axis_labels():轴的名称

g.set(xticks, yticks):x,y的取值

g.fig.subplots_adjust(wspace, hspace):间隙

多变量

g.PairGrid()

g.map_diag()

g.map_offdiag()

热度图:sns.heatmap(data, vmin, vmax, center, annt,fmd, linewidth, cmap)

annot:在每一格中显示数字

fmd:显示数字的格式

linewidth:格间距离

cmap:颜色图


原文链接:https://blog.csdn.net/Lucia_0103/article/details/88549852


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
27.5907 2 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子