SPSS统计分析案例:一元线性回归-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读SPSS统计分析案例:一元线性回归

SPSS统计分析案例:一元线性回归

2017-06-22

SPSS统计分析案例:一元线性回归

一元线性回归，顾名思义，仅有一个自变量的回归模型，研究的是一个因素对结果的影响，可以用于预测，也经常被称之为简单线性回归分析。它的模型表达式为：

Y=a+bX+e

回归的过程就是要确定截距a和回归系数b的具体值，当然前提条件是模型具备统计学意义。

看案例：

案例数据很好理解，是常见的销售数据，反映的是某公司太阳镜一年12个月的具体销售情况。试分析当广告费用为15万元时，预测当月的销售量值。

几乎所有的回归分析问题，首先都从一个散点图开始，散点图能够快速而且直观的看到自变量和应变量之间是否包含线性关系，如果图形上看不出明显线性关系的话，后续的分析效果也不会太好。

散点图菜单步骤：图形→旧对话框→散点图→简单算点图，自变量广告费用用作X轴，销售量用作Y轴。

由散点图可以看出，增加广告投入销售量随之上升，一个正相关线性关系，图示的作用在于让我们对预测销售量充满信心，接下来开始一元线性回归。

一调出主面板

菜单栏中点击【分析】→【回归】→【线性】，弹出线性回归主功能面板，销售量作为因变量，广告费用作为自变量，散点图显示二者有较强的线性关系，我们将采取强制【输入】的方法要求建立一元回归模型。

二统计按钮参数设置

默认勾选回归系数的【估算值】，要求SPSS软件为我们输出回归系数，也就是模型中的参数b，同时默认勾选【模型模拟】，要求软件帮助我们建议回归模型是否具有统计学意义。

以上这两个参数是线性回归分析必选设置，不能忽略不计。在此基础上，我们可以根据实际需要选择其他参数。

本案例勾选【德宾沃森】，要求就模型残差进行Durbin Watson检验，用于判断残差是否独立，作为一个基础条件来判断数据是否适合做线性回归。

三图按钮参数设置

上半部分有些复杂，允许我们定制残差的图形，作为入门理解，此处建议直接勾选底部【直方图】和【正态概率图】，要求软件输出标准化残差图，同样用于判断数据是否适合进行线性回归。

四保存按钮参数设置

我们此处分析的目的是为了利用广告费用来预测销售量，保存按钮参数与预测和残差有关，可以勾选【未标准化】预测值。

在这个对话框上面，有许多参数可选，严谨态度出发的话，建议在这里深入学习，本例暂时不讨论。

五选项按钮参数设置

这里建议接受软件默认选项即可。

主要参数基本设置完成，现在点击主面板下方的【确定】按钮，要求SPSS开始执行此次简单线性回归分析过程，我们坐等结果。

六主要结果解释

1、模型摘要表

第三列R方，在线性回归中也称为判定系数，用于判定线性方程拟合优度的重要指标，体现了回归模型解释因变量变异的能力，通常认为R方需达到60%，最好是80%以上，当然是接近1更好。

本例R方=0.93，初步判断模型拟合效果良好。

2、方差分析表

刚才我们建立的回归模型是不是有统计意义，增加广告费用可销售量这样的线性关系是否显著，方差分析表可以回答这些问题。

直接读取最后一列，显著性值=0.000<0.01<0.05，表明由自变量“广告费用”和因变量“销售量”建立的线性关系回归模型具有极显著的统计学意义。

3、回归系数表

这是有关此处建模的最直接结果，读取未标准化系数，我们可以轻松写出模型表达式，如下：

Y=76.407+7.662X

关键的是，自变量广告费用的回归系数通过检验，t检验原假设回归系数没有意义，由最后一列回归系数显著性值=0.000<0.01<0.05，表明回归系数b存在，有统计学意义，广告费用与销售量之间是正比关系，而且极显著。

OK，现在我们有了回归模型表达式在手里，心里总会油然沉甸甸的，因为就连小学生都知道，只要把广告费用的具体值带入回归方程式中，就可以轻松计算出对应的销售量数据。

不急，在开始预测前还有一项关键操作，我们需要检验数据是否可以做回归分析，它对数据的要求是苛刻的，有必要就残差进行分析。

七适用性检验

1、残差正态性检验

从标准化残差直方图来看，呈一个倒扣的钟形，左右两侧不完全对称，有一定瑕疵；从标准化残差的P-P图来看，散点并没有全部靠近斜线，并不完美，综合而言，残差正态性结果不是最好的，当然在现实分析当中，理想状态的正态并不多见，接近或近似即可考虑接受。

2、模型残差独立性检验

采用Durbin Watson检验来判断，回过头来再看模型摘要表。

DW=1.464，查询 Durbin Watson table 可以发现本例DW值恰好出在无自相关性的值域之中，认定残差独立，通过检验。

实际上关于回归模型的适应性检验还有其他项目，比如异常点、共线性等检验项目，本例暂不展开，有兴趣的读者可以自行学习。

根据以上残差正态性和残差独立性检验的结果，本例认为案例数据基本满足线性回归要求（值得在其他应用中讨论，本例仅展示主要过程），所建立的模型可根据拟合质量进行预测。

八预测

通过前面的一系列分析和论证，我们现在已经得到回归模型的方程式：Y=76.407+7.662X，

我们的预测任务是当广告投入达15万元时，太阳镜的销售量，具体计算：Y=76.407+7.662*15=191.337，

至此，建立了广告和销售量之间的线性回归模型，并且实施了预测，那么模型的准确性到底如何呢，有待最终实际销售比对分析。本例结束。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

线性回归散点图回归分析 R方方差分析方差直方图模型解释

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇回归系列（一）| 怎样正确地理解线性回归

下一篇2020美国总统竞选大戏开锣，川普当选的奇迹会再发生吗？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

SPSS统计分析案例:一元线性回归

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】AARRR用户增长漏斗模型全解析：从理论到 ...

【CDA干货】随机森林特征重要性分析全解析：从原理 ...

CDA数据分析师：精通表格结构数据核心功能，解锁高 ...

【CDA干货】一文读懂Excel箱线图含义：用简单图表解 ...

【CDA干货】ROC曲线阈值优化指南：如何科学提高阈值 ...

CDA数据分析师：以专业报告呈现，解锁数据洞察的落 ...

【CDA干货】主成分分析（PCA）实战全解析：从原理简 ...

【CDA干货】解析数据分析中基准比的本质：离基准值 ...

CDA数据分析师：驾驭业务数据分析全步骤，赋能业务 ...

【CDA干货】信贷违约率的统计分布特征与测算方法研 ...

【CDA干货】业务效果AB增量评估体系：搭建、实操与 ...

CDA数据分析师：以战略分析方法为翼，赋能企业长远 ...

【CDA干货】复杂抽样的统计描述：方法、要点与实操 ...

【CDA干货】详解聚合函数：可一次使用多个吗？实操 ...

CDA数据分析师视角：战略数据分析与业务数据分析的 ...

【CDA干货】详解B+树叶子节点指针：双向还是单向？ ...

【CDA干货】警惕！REPLACE(UUID(), '-', '')用于INS ...

CDA数据分析师与商业数据分析总体流程：全链路实操 ...

【CDA干货】通过标准差与平均值关系衡量数据波动性 ...

【CDA干货】基于GB标准的t检验、F检验与显著性差异 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载