Copyright © 2015-2021,
www.cda.cn
All Rights Reserved. CDA数据分析师(北京国富如荷网络科技有限公司) 版权所有
京ICP备11001960号-9
京公网安备 11010802034615号
经营许可证编号:京B2-20210330

联系电话:13321103290 (微信同号)
2020-07-09
数据标准化(normalization)是一个常用的数据预处理操作,就是对原始各项指标数据按比例进行缩放,将数据的单位限制去除,转化为无规模、无量纲的纯数值,减少规模、特征、分布差异等对模型的影响,以便于不同单位或量级的指标能够进行比较和加权。
下面小编整理了三种最常用的标准化方法:min-max法(规范化方法),z-score法(正规化方法),归一化。
1.min-max法(规范化方法)也叫离差标准化,是对原始数据的线性变换,使结果映射到[0.1]区间
2.Z-Score(正规化方法)标准化是基于原始数据的均值和标准差进行的标准化。
标准化之后的数据是以0为均值,方差为1的正态分布。需要注意的是:Z-Score方法是一种中心化方法,这会改变原有数据的分布结构,对于稀疏数据的处理不太适合。
z-score的简单化模型:y=1/(1+x) ,x越大证明y越小,这样就可以把很大的数规范在[0-1]之间了。
3.归一化
注意该方法主要用于全部数据为正值的序列。
完 谢谢观看
上一篇: 对于KNN算法概念以及原理的简单理解 ... 下一篇: 3种常见集成算法模型的详细理解 ...