登录
首页大数据时代这3种数据标准化方法,你知道吗?
这3种数据标准化方法,你知道吗?
2020-07-09
收藏

数据标准化(normalization)是一个常用的数据预处理操作,就是对原始各项指标数据按比例进行缩放,将数据的单位限制去除,转化为无规模、无量纲的纯数值,减少规模、特征、分布差异等对模型的影响,以便于不同单位或量级的指标能够进行比较和加权。

下面小编整理了三种最常用的标准化方法:min-max法(规范化方法),z-score法(正规化方法),归一化。

1.min-max法(规范化方法)也叫离差标准化,是对原始数据的线性变换,使结果映射到[0.1]区间

2.Z-Score(正规化方法)标准化是基于原始数据的均值和标准差进行的标准化。


标准化之后的数据是以0为均值,方差为1的正态分布。需要注意的是:Z-Score方法是一种中心化方法,这会改变原有数据的分布结构,对于稀疏数据的处理不太适合。

z-score的简单化模型:y=1/(1+x) ,x越大证明y越小,这样就可以把很大的数规范在[0-1]之间了。

3.归一化


注意该方法主要用于全部数据为正值的序列。

数据分析咨询请扫描二维码

客服在线
立即咨询