詹惠儿

2018-11-12   阅读量: 735

数据分析师 Python编程 Python数据分析

python中的方差分析

扫码加入数据分析学习群

方差分析

ANOVA代表方差分析。执行以确定不同分类数据组之间的关系。
在ANOVA下我们有两个测量结果:
- F-testscore:显示组的变量意味着变化
p值:它显示结果的重要性
这可以使用python模块scipy方法名称f_oneway()执行
语法:


import scipy.stats as st
st.f_oneway(sample1, sample2, ..)

这些样品是每组的样品测量值。
作为结论,我们可以说,如果ANOVA检验给我们一个大的F检验值和一个小的p值,那么其他变量和分类变量之间存在很强的相关性。

那么什么是相关性呢

相关性是上下文中两个变量之间的简单关系,一个变量影响另一个变量。相关性与引起的行为不同。计算变量之间相关性的一种方法是找到Pearson相关性。在这里我们找到两个参数,即Pearson系数和p值。我们可以说,当Pearson相关系数接近1或-1且p值小于0.0001时,两个变量之间存在强相关性。
Scipy模块还提供了一种执行pearson相关分析的方法,语法:

import scipy.stats as st
st.pearsonr(sample1, sample2)

这里的样本是您要比较的属性。
这是python中EDA的简要概述,我们可以做更多!快乐挖!

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 2 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子