SPSS聚类分析是否需要对数据进行标准化处理？-CDA数据分析师官网

热线电话：13121318867

登录

首页精彩阅读SPSS聚类分析是否需要对数据进行标准化处理？

SPSS聚类分析是否需要对数据进行标准化处理？

2016-03-15

收藏

SPSS聚类分析是否需要对数据进行标准化处理？

为了从不同的角度反映一组数据的特征，我们往往追求更多的指标，这些数据单位不同，数量级也不同，这就需要我们在开始分析之前对数据进行标准化处理。聚类分析就经常遇到，因为聚类就是利用多个指标来对样本进行分类的统计方法。

那么，SPSS聚类分析是否需要对数据进行标准化处理呢？经常有人提问。

问：SPSS聚类分析是否需要对数据进行标准化处理？-09大数据

首先，从聚类分析的概念上来判断。

聚类的要求是同一类的样本有较大的相似性，不同类的样本有较大的差异性。那如何才算是有相似性呢？这里经常用的就是判断点与点之间的距离是不是很近或者有相关性，只要是用距离来判断，就涉及到不同指标的运算，而量纲和数量级上的差异对距离的判断有很大的影响，为了消除这种影响，因此在聚类前需要对数据进行标准化处理。

有一种例外情况，如果采用相关系数来衡量个体的相似性，可以不做标准化处理，也留给大家讨论。

其次，我们从聚类操作对话框来看。

SPSS软件封装了3种聚类方法，TwoStep、Kmeans、Hierarchical。

先来看TwoStep聚类，如下图对话框。

问：SPSS聚类分析是否需要对数据进行标准化处理？-09大数据

SPSS明确指出需要对连续变量进行标准化操作，这个选项非常适合初学者，把数据质量的因素直接考虑进去，我们只需要按照提示一步步来完成即可。

再来看Kmeans聚类，如下图，

问：SPSS聚类分析是否需要对数据进行标准化处理？-09大数据

我们发现，SPSS并没有在这个过程中预装标准化操作，因此对于刚接触SPSS的人来说，就会造成一定的困惑或者麻烦，会认为完全按照spss的菜单项操作就可万无一失，从这一例子来看，SPSS初学者一定不能有这样的惰性思维，SPSS为我们提供便捷菜单操作的同时，我们仍然不能放弃基本的数据分析思维。

再看Hierarchical聚类过程，对话框如下图，

问：SPSS聚类分析是否需要对数据进行标准化处理？-09大数据

spss同样预装了数据标准化操作，SPSS菜单操作的便捷一目了然。

总结

讲到这里，大家对这个问题应该比较清晰。小兵再次提醒大家，不管SPSS是否在菜单选项中提供数据标准化处理，作为分析师，首先我们要有提前标准化的思维习惯，数据标准化也是数据预处理中的一项重要工作。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

大数据数据标准化 Kmeans 层次聚类特征数据分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇回归系列（一）| 怎样正确地理解线性回归

下一篇2020美国总统竞选大戏开锣，川普当选的奇迹会再发生吗？

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

更多

Copyright © 2015-2021, www.cda.cn All Rights Reserved. CDA数据分析师(北京国富如荷网络科技有限公司) 版权所有京ICP备11001960号-9

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

OK

客服在线

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册