数据可视化库——Matplotlib
import matplotlib.pyplot as plt
1
默认可视化操作
plt.plot():画图
plt.show():显示
设置参数
plt.xticks(rotation):变量名倾斜
plt.xlable(‘变量名’):x轴名称
plt.ylabel(‘变量名’):y轴名称
plt.title():标题名称
子图
fig=plt.figure():指定默认画图空间
fig.add_subplot(4,1,x):x代表相对位置
加注释:plt.legend(loc=‘best’) 'best’代表注释框的位置
绘图种类:fig,ax=plt.subplots(),ax是画图的轴,实际画图;fig用来设置参数
柱形图:
ax.bar(bar_positions, bar_heights, 0.5),0.5代表柱宽
ax.barh():橫柱形图
散点图:ax.scatter(x, y)
直方图(有bins):
ax.hist(y, range(4,5), bins=20),range设置了值的范围
ax.set_ylim(0.5):设置y轴范围
盒图:ax.boxplot()
在某元素上加文字:ax.text(x, y, ‘text’)
可视化库——Seaborn
import seaborn as sns
1
Seaborn库是在Matplotlib库基础上的封装
设置风格
sns.set():默认风格
sns.set_style(“风格”):5种风格
with sns.axes_style(“风格”):with下的语句全部使用这种风格
布局
sns.despline(offset, left):设置轴线的偏置及显示
sns.set_context(“paper”):设置图中曲线大小
调色板:sns.color_palette(),共有6个主题
圆形画板:sns.color_palette(“hls”)
成对:“Paired”
连续型
sns.color_palette(“Blues”):由浅到深
sns.color_palette(“Blues_r”):由深到浅
sns.light_palette(“green”):由浅到深,reverse=True表示由深到浅
sns.dark_palette(“green”):由深到浅
线型:sns.cubehelix_palette(8, start, rot)
变量分析
单变量:sns.distplot(x, kde, bins, fit)——直方图
x:变量
kdn:估计和密度
bins:将x轴分为几份
fit:分布状态
双变量:
sns.jointplot(x, y, data)——散点图
sns.jointplot(x, y, kind=“hex”, color)——可体现数据密度
多变量
sns.pairplot():体现两两变量之间的关系
sns.stripplot(x, y, data):不推荐,数据量大时连成一条线
优化方法:
sns.stripplot(x, y, data, jitter=True)——加小幅度的抖动
sns.swamplot(x, y, data)——树状
sns.violinplot(x, y, hue, data, split)——小提琴图
回归分析:regplot,lmplot
sns.load_dataset(“数据”)——下载数据
sns.regplot(x, y, data, jitter)
分类分析
sns.barplot(x, y, hue, data):条形图,描绘整体趋势
sns.pointplot(x, y, hue, data):点图,描绘变化差异
sns.factorplot(x, y, data, kind):多层面板分类图
Facetgrid——展示子集
使用方法
g=sns.FacetGrid(data, col)
g.map(plt.hist, “变量”)
设置参数
g.set_axis_labels():轴的名称
g.set(xticks, yticks):x,y的取值
g.fig.subplots_adjust(wspace, hspace):间隙
多变量
g.PairGrid()
g.map_diag()
g.map_offdiag()
热度图:sns.heatmap(data, vmin, vmax, center, annt,fmd, linewidth, cmap)
annot:在每一格中显示数字
fmd:显示数字的格式
linewidth:格间距离
cmap:颜色图
原文链接:https://blog.csdn.net/Lucia_0103/article/details/88549852








暂无数据