291294878

2018-10-16   阅读量: 1352

数据分析师 统计学

怎样实现数据的归一化和标准化?

扫码加入数据分析学习群

严谨来说,归一化只是标准化的一种方式,最常见的是以下两种:

1、min-max标准化(Min-max normalization)

x*=(x-min)/(max-min)

可映射到[0,1],若为了映射到[-1,1],则在此基础上2x*-1

注:这种方法有一个缺陷就是当有新数据加入时,可能导致max和min的变化,需要重新定义。

2、z-score标准化(zero-mean normalization)

x*=(x-μ)/σ

其中μ为所有样本数据的均值,σ为所有样本数据的标准差。经过处理后的数据符合标准正态分布,前提是要求原始数据近似符合正态分布

3、此外还有log函数转换atan函数转换等

x*=log10(x)/log10(max)

x*=atan(x)*2/π

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
230.1389 9 1 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子