liting李

2021-04-26   阅读量: 960

Python Scikit-learn

特征选择中什么是过滤式?

扫码加入数据分析学习群

滤式方法先对数据集进行特征选择,然后再训练学习器。特征选择过程与后续学习器无关,这相当于先对初始特征进行“过滤”,再用过滤后的特征训练模型。


过滤式选择的方法有:


  1. 移除低方差的特征;


  2. 相关系数排序,分别计算每个特征与输出值之间的相关系数,设定一个阈值,选择相关系数大于阈值的部分特征;


  3. 利用假设检验得到特征与输出值之间的相关性,方法有比如卡方检验、t检验、F检验等。


  4. 互信息,利用互信息从信息熵的角度分析相关性。



131.6067 1 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子