构建模型时为什么要尽量将偏态数据转换为正态分布数据？_CDA答疑社区

热线电话：13121318867

登录

liting李

2020-09-14 阅读量: 2660

构建模型时为什么要尽量将偏态数据转换为正态分布数据？

数据整体服从正态分布，那样本均值和方差则相互独立。

正态分布具有很多好的性质，很多模型假设数据服从正态分布。例如线性回归(linear regression)，它假设误差服从正态分布，从而每个样本点出现的概率就可以表示成正态分布的形式，将多个样本点连乘再取对数，就是所有训练集样本出现的条件概率，最大化这个条件概率就是LR要最终求解的问题。这里这个条件概率的最终表达式的形式就是我们熟悉的误差平方和。总之， ML中很多model都假设数据或参数服从正态分布。

30.4704

1

0

关注作者

收藏

评论(0)

发表评论

暂无数据

CDA考试动态

CDA报考指南

推荐帖子