热线电话:13121318867

登录
2020-04-07 阅读量: 830
特征选择F检验标准化以后是不是跟卡方过滤没有太大区别?

卡方过滤是专门针对离散型标签(即分类问题)的相关性过滤。卡方检验类feature_selection.chi2 计算每个非负特征和标签之间的卡方统计量,并依照卡方统计量由高到低为特征排名。

F检验,又称ANOVA,方差齐性检验,是用来捕捉每个特征与标签之间的线性关系的过滤方法。它即 可以做回归也可以做分类,因此包含feature_selection.f_classif(F检验分类)和 feature_selection.f_regression(F检验回归)两个类。其中F检验分类用于标签是离散型变量的数据,而F检验回归用于标签是连续型变量的数据。F检验在数据服从正态分布时效果会非常稳定,因此 如果使用F检验过滤,我们会先将数据转换成服从正态分布的方式。

统计量的计算方法不同,但都是度量的x与y的相关性是否显著

2.7812
2
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子