2019-02-27
阅读量:
833
什么时候使用特征缩放?
真实世界数据集包含大小,单位和范围变化很大的特征。当特征的尺度不相关或误导时应该执行标准化,而当尺度有意义时不应该标准化。
使用欧氏距离测量的算法对幅度敏感。这里的特征缩放有助于平等地权衡所有特征。
形式上,如果数据集中的某个特征与其他特征相比规模较大,则在测量欧几里德距离的算法中,这个大尺度特征变得占主导地位,需要进行标准化。
特征缩放很重要的算法示例
1. K-Means使用欧几里德距离测量这里的特征缩放问题。
2. K-Nearest-Neighbors也需要特征缩放。
3. 主成分分析(PCA):试图获得具有最大方差的特征,这里也需要特征缩放。
4. 梯度下降:在特征缩放后,Theta计算变得更快,计算速度增加。
注意:朴素贝叶斯,线性判别分析和基于树的模型不受特征缩放的影响。
总之,这是任何算法不是基于距离的是不影响特征缩放。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论