提问：数据量纲化我知道了，无量纲化又是什么

啊啊啊啊啊吖

2021-05-26 阅读量: 1195

数据无量纲化

在机器学习算法实践中，我们往往有着将不同规格的数据转换到同⼀规格，或不同分布的数据转换到

某个特定分布的需求，这种需求统称为将数据“无量纲化”。比如梯度和矩阵为核⼼的算法中，对于逻辑

回归，⽀持向量机，神经⽹络等，⽆量纲化可以加快求解速度；⽽在距离类模型，⽐如K近邻，KMeans聚类中，⽆量纲化可以帮我们提升模型精度，避免某⼀个取值范围特别⼤的特征对距离计算造成

影响。（⼀个特例是决策树和树的集成算法们，对决策树我们不需要⽆量纲化，决策树可以把任意数据

都处理得很好。）

数据的无量纲化可以是线性的，也可以是非线性的。线性的⽆量纲化包括中⼼化（Zero-centered或

者Mean-subtraction）处理和缩放处理（Scale）。中⼼化的本质是让所有记录减去⼀个固定值，即让

数据样本数据平移到某个位置。缩放的本质是通过除以⼀个固定值，将数据固定在某个范围之中，取对

数也算是⼀种缩放处理。

272.6202

关注作者

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子