从今天开始不熬夜

2022-09-14   阅读量: 476

Python 数据分析师

高斯马尔克夫假定

扫码加入数据分析学习群

高斯马尔克夫假定也即经典线性假定:

1.线性与参数:即贝塔零,贝塔一,贝塔二等都是线性的,当散点图呈现非线性的模式得调优.

2. 随机抽样:误差无序列相关性(自相关性),当有时间属性的时候,极有可能有相关性,用dw(杜宾)检验判断残差是否有序列相 关性,若统计值约等于2(±0.5),则没有序列相关性,若有,则可以利用时间序列的相关性解决。

3. 不存在完全共线性,即自变量X之间不能有太高的相关性.

4.误差的条件均值为零(内生性),即cov(x,ε )=0,若遗漏重要变量时,此公式不为零,事实上在企业的实际问题中一般会忽视掉此假设, 因为无法找到所有相关性变量.另外Hause man test 可以找出内生性问题,可以用工具变量法解决,但一般也只能解决宏观性问 题.

5.误差同方差性,即误差的方差为常数 δ^2=C,若不为常数称为异方差,残差的散点图若为喇叭口状,或音波状的则为异方差,处理方 式是对因变量Y取自然对数,ln(1+y),通常加1,避免数值过大.

6.误差的正态性(正态分布),可以利用残差正态概率图判别(QQ图),也可以直接用JB检验(原假设H0:残差是正态分布的,因此P值要大 于0.05才能说明是正态的),若不为正态,处理方式:对因变量Y取自然对数,ln(1+y),通常加1,避免数值过大.

133.3245 2 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子