2018-11-20
阅读量:
828
常用的数据标准化
常用的数据标准化方法有三种:
Z-score标准化
Z-score,又称为标准分数,可以用公式

来计算。其中x逐一带入变量中的数据,μ为变量的平均数,σ为变量的标准差。
Z-score可以理解为,数据落在平均值几倍的标准差范围内。变换后,变量的取值范围仍然是(-∞,+∞)。新生成的变量均值为0,方差为1。在不确定最大最小值,或者存在极端离群点的情况下,用Z-score标准化是比较好的选择。
最大最小标准化
最大最小标准化,也是一种常见的标准化方法。可以用公式

来计算。其中逐一带入变量中的数据,max和min分别是变量的最大值和最小值。
变换后,变量的取值范围变为[0,1]。
最大最小标准化有一个缺陷是,当引入新的数据后,需要重新计算max和min的取值。
小数定标法
小数定标法是通过移动数据的小数点位置进行标准化






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
0条评论