热线电话:13121318867

登录
2018-11-20 阅读量: 828
常用的数据标准化

常用的数据标准化方法有三种:

Z-score标准化

Z-score,又称为标准分数,可以用公式

来计算。其中x逐一带入变量中的数据,μ为变量的平均数,σ为变量的标准差。

Z-score可以理解为,数据落在平均值几倍的标准差范围内。变换后,变量的取值范围仍然是(-∞,+∞)。新生成的变量均值为0,方差为1。在不确定最大最小值,或者存在极端离群点的情况下,用Z-score标准化是比较好的选择。

最大最小标准化

最大最小标准化,也是一种常见的标准化方法。可以用公式

来计算。其中逐一带入变量中的数据,max和min分别是变量的最大值和最小值。

变换后,变量的取值范围变为[0,1]。

最大最小标准化有一个缺陷是,当引入新的数据后,需要重新计算max和min的取值。

小数定标法

小数定标法是通过移动数据的小数点位置进行标准化

62.1152
1
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子