京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS数据分析—多维尺度分析
在市场研究中,有一种分析是研究消费者态度或偏好,收集的数据是某些对象的评分数据,这些评分数据可以看做是对象间相似性或差异性的表现,也就是一种距离,距离近的差异性小,距离远的差异性大。而我们的分析目的也是想查看这些对象间的差异性或相似性情况,此时由于数据的组成形式不一样,因此不能使用对应分析,而需要使用一种专门分析此问题的方法——多维尺度分析(MDS模型)。多维尺度分析和对应分析类似,也是通过可视化的图形阐述结果,并且也是一种描述性、探索性数据分析方法。
基于以上,我们可以得知,多维尺度分析经常使用在市场研究中:
① 可以确定空间的维数(变量、指标),以反映消费者对不同品牌的认知,并且在由这些维构筑的空间中,标明某关注品牌和消费者心目中理想品牌的位置,选择的品牌不宜过少也不宜过多,一般7-9个。
② 可以比较消费者和非消费者对企业形象的感觉。
③ 在进行市场细分时,可以在同一空间对品牌和消费者定位,然后把具有相似感觉的消费者分组、归类。
④ 在新产品开发方面,通过在空间图上寻找间隙,可以发现由这些间隙为企业带来的潜在契机。
⑤ 在广告效果的评估方面,可以用空间图去判定一个广告是否成功地实现了期望的品牌定位。
⑥ 在价格策略方面,通过比较加入与不加入价格轴的空间图,可以推断价格的影响强度。
⑦ 在分销渠道策略方面,利用空间图可以判断品牌对不同零售渠道的适应性,从而为制定有效的分销渠道提供依据。
在市场研究中,我们要注意的是选择的品牌数量要适中,并且分析的问题要明确,每组数据只能分析一个问题,比如对一组饮料产品收集的数据不能既反映口感又反映价格。
多维尺度分析收集的数据值大小必须能够反应两个研究对象的相似性或差异性程度。这种数据叫做邻近数据,所有研究对象的邻近数据可以用一个邻近矩阵表示。反映邻近的测量方式有:
相似性-数值越大对应着研究对象越相似。 差异性-数值越大对应着研究对象越不相似。
测量邻近性数据的类型有:
①两个地点(位置)之间的实际距离。(测量差异性)
②两个产品之间相似性或差异性的消费者心理测量。(差异性或相似性)
③两个变量的相关性测量。(相关系数测量相似性)
④从一个对象过渡到另一个对象的转换概率。例如概率反应了消费者对品牌或产品偏好的变化。(测量相似性)
⑤反映两种事物在一起的程度。例如:用早餐时人们经常将哪两种食品搭配在一起。(测量相似性)
⑥谁喜欢谁,谁是谁的领导,谁传递给谁信息,谁是谁的上游或下游等等社会网络数据等(测量相似性)
邻近数据即可以直接测量(距离),也可以通过计算得到(变量间的相关系数)。
多维尺度模型根据测量的尺度不同可以分为:
①古典MDS模型,针对收集的数据为比率和区间,也就是直接可以测量距离的情况
②非度量MDS模型,收集的数据为有序数据,针对无法直接测量距离,只能通过评分测量的情况
根据测量的个体数量不同,可以分为
①不考虑个体差异的MDS模型(ALSCAL),即单个测量个体
②考虑个体差异的MDS模型(INDSCAL),即多个测量个体
这里说的测量个体并不是选取的测量指标,而是实际测量的个体,相当于样本。
由于多维尺度分析是用来分析差异性或相似性的,也带有度量的含义,因此在SPSS中也将其归在了度量过程中。共有三个过程,下面我们来分别介绍
一、不考虑个体差异的MDS模型
本案例进行的是最基本的多维尺度分析,目的是分析每个城市的距离情况,只有一个个体,并且收集的数据直接是距离数据,因此采用古典MDS模型,数据组成如下
分析—度量—多维尺度(ALSCAL)
二、考虑个体差异的MDS模型
实际分析中,我们往往不会只选取一个样本,比如受访者肯定不止一个,那么收集上来的数据会变成多个矩阵,如果将其浓缩为一个矩阵会损失大量数据信息,而直接使用重复多维尺度模型当然也是可以的,但是该方法没有考虑个体间差异,因此并非最佳选择。而考虑个体差异的MDS模型不仅分析对象间的结构,而且会进一步分析对象间的差异。
本例中识10位受访者对10种饮料的口感差异性评分,分值越大差异越大,10位受访者的数据形成了10个数据阵,数据如下
下面我们选用考虑个体差异的MDS模型进行分析
三、基于最优尺度变换的MDS模型
将最优尺度变换引入MDS模型式对传统MDS模型的拓展,我们来看使用最优尺度变换的MDS模型再来分析一下饮料的数据
分析—度量—多维尺度(PROXSCAL)
四、多维展开模型
以上的MDS模型不管是传统MDS还是非度量MDS,都是要求各对象间不存在分组,分析时是直接考虑各对象两两间的距离远近。但是实际问题中,可能会遇到对象被分为两组,我们是想考察这多个组之间的相似性或差异性,而对组内对象间的距离远近并不关心,这时传统的MDS模型就不再适合,而需要采用多维展开模型进行分析。
看一个例子,现在收集了两组变量,一组是场景,共15个水平,另一组是行为,共15个水平。现在想分析这两组变量间的差异性或相似性,数据如下

我们用多维展开模型进行分析
分析—度量—多维展开(PREFSCAL)

接下来会分别输出行列变量的坐标,以及行列变量在二维分布图,但是我们实际上更关心的是行列变量的联合分布图
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16