京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SAS市场研究应用介绍:离散选择分析
一、离散选择分析(discrete choice analysis)介绍
联合分析是用来发掘消费者的偏好,指出了消费者将选择购买哪种组合(联合分析相关内容具体请参考上一文章介绍:SAS市场研究应用介绍:组合/联合分析)。在市场研究中,消费者实际做的选择是一种利益行为,那么用离散选择分析方法来直接分析消费者的选择是明智的,即离散选择法的目标是通过(特定个体的或者特定类别的)协变量解释所观察到的在离散对象中进行的抉择。
离散选择分析(模型),也叫做基于选择的结合分析模型(Choice-Based Conjoint Analysis),是一种非常有效且实用的技术,也是SAS市场研究模块中常用的一种技术方法。该模型是在实验设计的基础上,通过模拟所要研究产品/服务的市场竞争环境,来测量消费者的购买行为,从而获知消费者如何在不同产品/服务属性水平和价格条件下进行选择。这种技术可广泛应用于新产品开发、市场占有率分析、品牌竞争分析、市场细分和价格策略等市场营销领域。同时离散选择分析/模型也是一种处理离散的、非线性的定性数据的复杂高级多元统计分析技术,它采用Multinomial Logit Model进行数据分析。
二、离散选择分析/模型的基本概念和原理
离散选择模型主要用于测量消费者在实际或模拟的市场竞争环境下如何在不同产品/服务中进行选择,是市场研究领域中较为常见的一种研究方法。通常是在正交实验设计的基础上,构造一定数量的产品/服务选择集(Choice Set),每个选择集包括多个产品/服务的轮廓(Profile),每一个轮廓是由能够描述产品/服务重要特征的属性(Attributes)以及赋予每一个属性的不同水平(Level)组合构成。例如消费者购买手机的重要属性和水平可能包括:品牌(A,B,C)、价格(1500元,1750万元,2000元)、功能(短信,短信语音,图片短信)等,离散选择模型是测量消费者在给出不同的产品价格、功能条件下是选择购买品牌A,还是品牌B或者品牌C,还是什么都不选择。
离散选择模型的一个重要的假定是:消费者是根据构成产品/服务的多个属性来进行理解和作选择判断;另一个基本假定是:消费者的选择行为要比偏好行为更接近现实情况。
它与传统的全轮廓结合分析(Full Profiles Conjoint Analysis)都是在全轮廓的基础上采用分解的方法测量消费者对某一轮廓(产品)的选择与偏好,对构成该轮廓的多个属性和水平的选择与偏好,用效用值(Utilities)来描述。但是,它与传统的结合分析的最大区别在于:离散选择模型不是测量消费者的偏好,而是获知消费者如何在不同竞争产品选择集中进行选择。
因此,离散选择模型在市场研究之价格研究中是一种更为实际、更有效、也更复杂的技术。具体表现在:
l 将消费者的选择置于模拟的竞争市场环境,“选择”更接近消费者的实际购买行为;消费者的选择行为要比偏好态度更能反映产品不同属性和水平的价值,也更具有针对性;
l 消费者只需做出“买”或“不买”的回答,数据获得更容易,也更准确;
l 消费者可以做出“任何产品都不购买”的决策,这与现实是一致的;
l 实验设计可以排除不合理的产品组合,同时可以分析产品属性水平存在交互作用的情况;
l 离散选择集能够较好地处理产品属性水平个数(大于4)较多的情况;
l 统计分析模型和数据结构更为复杂,但可以模拟更广泛的市场竞争环境;
l 模型分析是在消费者群体层面,而非个体层面。
离散选择模型主要采用离散的、非线性的Multinomial Logit统计分析技术,其因变量是消费者在多个可选产品中,选择购买哪一种产品;而自变量是构成选择集的不同产品属性。
三、离散选择模型的主要步骤
任何一项采用离散选择模型进行的市场研究,都包括从确定研究目的、实验设计、数据收集、数据整理、数据分析和计算、检验与应用、模拟市场、撰写研究报告等全过程,必须借助专用的分析软件来实现。
采用离散选择模型的主要步骤如下:
属性和水平的确定
离散选择模型最重要的一步就是决定能描述产品/服务特征的重要属性。针对不同的研究目的,影响消费者选择购买或使用产品/服务的因素都要考虑。
选择集实验设计
当产品/服务的属性和水平数目不太多时可以将所有的产品/服务组合展现给消费者,即采用全因子实验设计(Full-Factorial Design),这种设计可以估计属性间的主效应(Main Effect),以及估计交互作用。
问卷设计和数据收集
离散选择模型是将产品/服务轮廓的属性水平组合成m种不同产品/服务,构造一个选择集,同时展现给消费者,从中选择一个最可能购买的产品/服务。也可以让消费者评价多个选择集,每个选择集可以包括“在该选择集中,任何产品都不购买”的选择,这样更接近现实情况。
数据编码和整理
离散选择模型对选择集的数据格式有特殊的要求,在进行数据分析之前必须将所有选择集进行重新编码,并与被访者的“选择”结果合并数据。
数据分析
离散选择模型是在消费者群体层面上进行分析,它主要包括两个方面,(1)选择频次分析:通过分析所有被访者对选择集中可选产品的选择频次,得到各属性水平的选择比率,也可以计算不同属性水平二维交互作用的选择比率,一般用百分比表示。(2)Logit模型选择概率分析:当选择数据经过编码整合后,就可以利用Multinomial Logit Model进行数据分析。该模型是一种复杂的多元统计分析过程,前面提到的SAS/STAT和Market模块的Prco PHREG过程可以用来估计未知参数向量
,并计算不同选择集中每个产品的选择概率。
结果检验和解释
离散选择模型的Multinomial Logit选择概率分析,主要是获得未知参数
估计值。参数估计值表明各属性的不同水平影响消费者选择某种产品/服务特征的价值或优先选择的程度,一般用“效用值”表示。效用值越大表明消费者越会首选具有该水平的产品/服务。
应用结果和模拟市场
离散选择模型可以在群体层面上得到影响消费者选择购买或使用产品/服务的属性水平的效用值,进而可以模拟市场竞争环境,构造不同选择集,计算选择频次比率和选择概率,获得消费者在不同产品/服务属性水平下的选择行为。可广泛应用于新产品开发、市场占有率分析、品牌竞争分析、市场细分和价格策略等市场研究领域。
三 、利用SAS应用:离散选择分析
注意的假设
在市场研究中常用于哪些
与一组实行安慰剂治疗的对照组(Control group)进行比较,看治疗方法是否成功
解释妇女的工作行为
选择某一专业学习
在一揽子商品中对某一商品的购买决策 (市场研究)
情景条件下的市场份额建模
根据“回忆者”(表现出来)的特征衡量广告活动的成功
解释顾客价值概念(分类模型)
顾客满意度研究(分类模型)
SAS自带数据集案例操作
这里我们选取一个SAS案例中数据应用来演示下,在离散选择分析中,被访者将对几种方案作出选择。影响选择的一些因素叫做“选择属性”(就像组合分析中的属性一样)。每种可能的选择叫做“选择设定”。
以sasuser中的price为例说明软件的使用:SAS->解决方案->市场研究->找到对应的数据集
选择price数据集,分析方法选择discrete choice analysis,ok后进入一个补充界面,提示数据集形式是否正确,可以点击examine,看数据集是否如其所显示的格式,如果不是则要重新将数据布局。
点击OK后进入变量界面,将要选择布置如下变量:一个因变量(response)、若干选择属性变量(choice)、一个测试变量(subject variable)。也可以选择一个频率变量(frequency)和若干非选择属性变量(non-choice variable),如果选择了频率变量,测试变量可以不必。
此例中,choose作为因变量,并点开下方的箭头,将1选入(1代表选择,0代表不选择)。选择price,band1,band2…band4作为选择属性变量(band5之所以不选,是因为band是一个虚拟变量)。Fre作为频率变量,频率变量记录了做出选择的数目。Set作为选择设定变量(choice set),点击OK。
结果显示band4,band1,price和band2对选择很重要。想了解更多结果,可以从结果菜单中选择“统计量”,“选中概率”来查看属性的系数估计和模型拟合情况,以及每种方案被选择的概率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10 很多数据分析师每天都在计算指标、制作报表,但当被问到“什么叫指标数据元”“指标数据标准包含哪些核心维度”“指标数据质 ...
2026-06-10在MySQL数据库日常查询、数据统计、后台接口开发、数据导出等场景中,开发者经常需要查询数据表除某几列之外的所有字段。例如查 ...
2026-06-09在Python网络请求、爬虫开发、接口测试、数据抓取等实操场景中,requests库是最常用的第三方请求工具,而content属性是requests ...
2026-06-09 数据分析正在重塑每一个行业。CDA认证的三本官方教材,分别对应Level I、Level II、Level III,为你铺就从业务数据分析到数 ...
2026-06-09在数字财务、智慧财税、业财融合深度推进的当下,传统财务模式下数据标准混乱、业务流程碎片化、知识无法沉淀、系统互通性差等问 ...
2026-06-08随着数字经济深度渗透各行各业,数据正式成为继土地、劳动力、资本、技术之后的第五大生产要素,是企业数字化转型、精细化运营、 ...
2026-06-08 很多数据分析师能熟练写SQL、做透视表,但当被问到“数据是从哪里来的?经过哪些加工才进入数据仓库?ETL具体做了什么?”时 ...
2026-06-08【核心关键词】贷款、报表、课程、专业、建模、缺失值、营销、互联网、银行、办公自动化、数据分析、数据预处理、特征工程、贷 ...
2026-06-05在数据库数据查询、业务报表统计、多表关联分析中,LEFT JOIN左连接是使用率最高的SQL关联查询语句。其核心特性是保留左表全部数 ...
2026-06-05 很多数据分析师能熟练地写SQL、做透视表、算描述性统计,但当被问到“如何预测用户流失概率”“如何归因销量下滑的关键因素 ...
2026-06-05任何一款产品从诞生、普及到最终退出市场,都会遵循一套固定的发展规律,这就是产品生命周期理论。在市场竞争日益激烈、产品迭代 ...
2026-06-04在Excel数据分析、办公统计、业务报表制作场景中,数据透视表是数据汇总、分类统计、快速复盘的核心工具,能够高效完成海量原始 ...
2026-06-04