2021-05-26
                                阅读量:
                                992
                            
                        提问:数据量纲化我知道了,无量纲化又是什么
                        数据无量纲化
在机器学习算法实践中,我们往往有着将不同规格的数据转换到同⼀规格,或不同分布的数据转换到
某个特定分布的需求,这种需求统称为将数据“无量纲化”。比如梯度和矩阵为核⼼的算法中,对于逻辑
回归,⽀持向量机,神经⽹络等,⽆量纲化可以加快求解速度;⽽在距离类模型,⽐如K近邻,KMeans聚类中,⽆量纲化可以帮我们提升模型精度,避免某⼀个取值范围特别⼤的特征对距离计算造成
影响。(⼀个特例是决策树和树的集成算法们,对决策树我们不需要⽆量纲化,决策树可以把任意数据
都处理得很好。)
数据的无量纲化可以是线性的,也可以是非线性的。线性的⽆量纲化包括中⼼化(Zero-centered或
者Mean-subtraction)处理和缩放处理(Scale)。中⼼化的本质是让所有记录减去⼀个固定值,即让
数据样本数据平移到某个位置。缩放的本质是通过除以⼀个固定值,将数据固定在某个范围之中,取对
数也算是⼀种缩放处理。
                                272.6202
                            
                                1
                            
                                0
                            
                                
                            
                                关注作者
                            
                                    收藏
                                                            评论(0)
                    
发表评论
暂无数据
                        
                        推荐帖子
                    
                0条评论
                        0条评论
                        0条评论
                        
            
                
                
