昨天回顾
列联分析:
用于定性变量(分类数据和顺序数据)对定性变量的影响
步骤:
1.
2.
3.计算期望频数
4.构造卡方分布
5.查找临界值,得出结论
列联分析有很多种不同的叫法:
差异性检验、关联性检验。独立性检验、依赖性检验、一致性检验
列联分析主要有两大作用:
拟合优度检验、独立性检验
列联分析检验多个总体多类别比例是否存在差异
列联分析有缺陷:
受样本量的影响,样本量越大,越容易导致差异
方差分析:
主要用于定性数据对定量数据是否有显著的影响
步骤:
1.提出假设:H0:没有差异,没有影响; H1:有差异
2.分析差异
计算各组平均数、总平均
计算SSA、SSE、SST
3.计算MSA、MSE
4.计算F=MSA/MSE,差临界值,决策
最终是比较了组间方差与组内方差,但是可以说明不同组均值是否有差异
相关分析:
定量变量对定量变量的影响
没有关系认为是关系很弱
思考:如何进行相关分析?
一、相关关系的描述----》描述有么有
二、相关关系的度量----》度量有多大
从图上可以看出,-----(x)和-----(y)有简单的、线性的、正相关的、不完全相关关系
算相关关系的:
=correlation()
或用数据分析—》相关系数—》选区域
相关系数的特点:
R的取值范围是【-1,1】
-1 ≤ r <0,为负相关; 0 < r ≤ 1,为正相关
R = 0,表明不存在线性相关关系
| r | = 1,为完全相关:r = 1,为完全正相关,r = -1,为完全负相关
| r |越趋于1表示关系越密切;| r |越趋于0表示关系越不密切
事物总有向大概率方向回归的趋势
一元线性回归分析步骤:
模型设定
模型估计
模型检验
模型应用
误差项ε是随机变量
**反映了除x和y之间的线性关系之外的随机因素对y的影响
**是不能由x和y之间的线性关系所解释的变异性
! ! !误差项ε的性质决定了模型的方法和使用
一元线性回归模型的基本假定
1.x与y之间具有线性关系
2.在重复抽样中,自变量x的取值是固定的,即x非随机
3. 误差项ε是一个期望值为0 的随机变量,即E(ε)= 0
4.对于所有的x值,ε的方差б方都相同
5.误差项ε是一个服从正态分布的随机变量,即相互独立。
模型检验—>
我们把样本回归线对样本观测数据拟合的优劣程度称为样本回归线的拟合优度
我们可以通过计算回归西线的拟合优度来对模型进行拟合优度检验
下面这个地方我们希望拒绝原假设才好
列联:定性对定性
方差:定性对定量
相关:定量对定量
回归:定量对定量








暂无数据