登录
首页大数据时代手把手教你如何使用seaborn绘图--数据集分布可视化
手把手教你如何使用seaborn绘图--数据集分布可视化
2020-08-10
收藏

seaborn是一款基于matplotlib的图形可视化python库,它提供了一种高度交互式界面,便于用户能够做出各种有吸引力的统计图表。seaborn主要是针对统计绘图的,一般来说,seaborn能满足数据分析90%的绘图需求,它最大的特点是简单。小编今天给大家分享的就是关于如何使用seaborn绘图的内容,希望对大家有所帮助。

一、常用参数

二、seaborn-数据集分布可视化

1.单变量分布


# 正态分布的500个数据
x1 = np.random.normal(size=500)
 
# 分布图,默认是直方+线型
sns.distplot(x1);


# 均匀分布的500个整数数据
x2 = np.random.randint(0, 100, 500)
 
# 分布图,默认是直方+线型
sns.distplot(x2);


# 分布图,bin是直方的个数,kde是线型(false表示去掉线型),rug显示每个数据的分布(下面深蓝色的部分)
sns.distplot(x1, bins=20, kde=False, rug=True)


				
# 核密度估计,hist表示直方(false表示不要直方)
sns.distplot(x2, hist=False, rug=True)


# 核密度函数也可以表示成如下,shade表示阴影
sns.kdeplot(x2, shade=True)
sns.rugplot(x2)


# 拟合参数分布
sns.distplot(x1, kde=False, fit=stats.gamma)

2.双变量分布


# 双变量分布
df_obj1 = pd.DataFrame({"x": np.random.randn(500),
                   "y": np.random.randn(500)})
 
df_obj2 = pd.DataFrame({"x": np.random.randn(500),
                   "y": np.random.randint(0, 100, 500)})
 
# print df_obj1
# print df_obj2
# 散布图
sns.jointplot(x="x", y="y", data=df_obj2)


# 二维直方图
sns.jointplot(x="x", y="y", data=df_obj2, kind="hex");


# 核密度估计
sns.jointplot(x="x", y="y", data=df_obj1, kind="kde");

3.数据集中变量间关系可视化


# 数据集中变量间关系可视化
dataset = sns.load_dataset("tips")
#dataset = sns.load_dataset("iris")
sns.pairplot(dataset);

以上就是小编今天跟大家分享的关于seaborn绘图的一些内容,希望对于大家seaborn的学习和使用有所帮助。











数据分析咨询请扫描二维码

客服在线
立即咨询