登录
首页精彩阅读SPSS统计分析:距离分析
SPSS统计分析:距离分析
2017-09-30
收藏

SPSS统计分析:距离分析

在偏相关分析中,关心的是某两个变量的相关性,因此需要控制其他认为“次要”变量的影响。实际上,事情往往比这更复杂,有时变量躲到无法一一关心的地步,它们都携带了一定的信息,但彼此又有重叠,此时最直接的办法就是将所有变量按照一定的标准进行分类,即聚类分析。但聚类分析是一种比较复杂的多元统计方法,指标太多时计算起来会比较繁琐和费时,如果能事先给点提示,就是使其更加简便和易用。本文介绍的距离分析就是一种简化数据的一种预分析过程,通过它可以得到初步的分析线索。

距离分析的基本概念

距离是对观察变量之间的相似或者不相似程度的一种测度,它计算的是1对变量之间或1对观测变量之间的广义距离。这些相似性或距离测度可以应用于其他分析过程,例如因子分析、聚类分析或多维尺度分析等,这样做有助于对复杂数据集的深入分析。

SPSS分析案例

用于衡量经济发展水平的指标很多,于是在做深入分析之前,有必要事先了解下这些指标之间的相似性,本节就用距离分析对这个问题加以研究。数据文件如下:

参数设置:

依次单击“分析——相关——距离···”,打开举例分析的主界面,如下图所示,在左侧变量列表选中除地区以外的所有变量,将其作为分析变量选入“变量”列表,分别单击选中“变量间”单选框和“相似性”单选框。

单击“度量”按钮,弹出如下界面。单击“转化值”栏的下拉列表,选中“Z得分”选项;单击“继续”按钮返回主界面。

结果分析:

从近似矩阵表给出的各变量之间的相似矩阵来看,图中标红色的较大相关系数的几对变量,包含第三产业增加值和GDP总值之间,第三产业从业人员比重分别和社会综合生产率、人均GDP之间、社会综合生产率分别和人均GDP、人均税收之间,人均GDP和人均税收之间,农村居民人均收入分别和社会综合生产率、人均GDP、人均税收这3个变量之间。它们在进一步分析中应该予以重点关注,或者直接对其进行适当的预处理。


数据分析咨询请扫描二维码

客服在线
立即咨询