手把手教你如何使用seaborn绘图--数据集分布可视化-CDA数据分析师官网

热线电话：13121318867

手把手教你如何使用seaborn绘图--数据集分布可视化

2020-08-10

seaborn是一款基于matplotlib的图形可视化python库，它提供了一种高度交互式界面，便于用户能够做出各种有吸引力的统计图表。seaborn主要是针对统计绘图的，一般来说，seaborn能满足数据分析90%的绘图需求，它最大的特点是简单。小编今天给大家分享的就是关于如何使用seaborn绘图的内容，希望对大家有所帮助。

一、常用参数

二、seaborn-数据集分布可视化

1.单变量分布

# 正态分布的500个数据
x1 = np.random.normal(size=500)
 
# 分布图，默认是直方+线型
sns.distplot(x1);

# 均匀分布的500个整数数据
x2 = np.random.randint(0, 100, 500)
 
# 分布图，默认是直方+线型
sns.distplot(x2);

# 分布图，bin是直方的个数，kde是线型（false表示去掉线型），rug显示每个数据的分布（下面深蓝色的部分）
sns.distplot(x1, bins=20, kde=False, rug=True)

				

	# 核密度估计，hist表示直方（false表示不要直方） 



	sns.distplot(x2, hist=False, rug=True)

# 核密度函数也可以表示成如下，shade表示阴影
sns.kdeplot(x2, shade=True)
sns.rugplot(x2)

# 拟合参数分布
sns.distplot(x1, kde=False, fit=stats.gamma)

2.双变量分布

# 双变量分布
df_obj1 = pd.DataFrame({"x": np.random.randn(500),
                   "y": np.random.randn(500)})
 
df_obj2 = pd.DataFrame({"x": np.random.randn(500),
                   "y": np.random.randint(0, 100, 500)})
 
# print df_obj1
# print df_obj2

# 散布图
sns.jointplot(x="x", y="y", data=df_obj2)

# 二维直方图
sns.jointplot(x="x", y="y", data=df_obj2, kind="hex");

# 核密度估计
sns.jointplot(x="x", y="y", data=df_obj1, kind="kde");

3.数据集中变量间关系可视化

# 数据集中变量间关系可视化
dataset = sns.load_dataset("tips")
#dataset = sns.load_dataset("iris")
sns.pairplot(dataset);

以上就是小编今天跟大家分享的关于seaborn绘图的一些内容，希望对于大家seaborn的学习和使用有所帮助。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

seaborn DataFrame 直方图 python 正态分布 matplotlib 数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇手把手教你安装数据分析利器--powerBI

下一篇教你使用Pyecharts绘制出精美地图

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

手把手教你如何使用seaborn绘图--数据集分布可视化

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】MySQL分表如何查询数据在哪张表？实战方 ...

【CAD干货】业务模型与逻辑模型的概念辨析及实战案 ...

从“零件”到“引擎”：CDA数据分析师视角下的指标 ...

CDA持证人专访：宋利宝谈电销行业数据运营与数据分 ...

【CDA干货】ARIMA时间序列分析方法：核心原理、建模 ...

从“通用基石”到“场景利器”：CDA数据分析师视角 ...

【CDA干货】SQL Server 提示“实例已在使用”：常见 ...

【CDA干货】Excel数据透视表两列相乘：正确计算方法 ...

从“模糊需求”到“精确标尺”：CDA数据分析师视角 ...

CDA持证人专访：冯卓基谈大数据平台搭建与行业数字 ...

【CDA干货】基于月度数据的送货率提升专项数据分析 ...

从“样本均值”到“总体真相”：CDA数据分析师视角 ...

【CDA干货】指标：量化业务的核心衡量标准与设计指 ...

【CDA干货】Excel透视表计算字段：先乘法后求和汇总 ...

从“杂乱”到“有序”：CDA数据分析师视角下的数据 ...

CDA持证人专访：崔爱军谈地产行业数据治理与数据中 ...

【CDA干货】显著水平与P值的核心区别、关联关系及实 ...

为什么统计是数据分析师的“底层语言”？ ...

【CDA干货】数据分析核心技能体系：从工具落地到业 ...

【CDA干货】企业价值市场法价值比率与线性回归分析 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载