京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SAS市场研究应用介绍:离散选择分析
一、离散选择分析(discrete choice analysis)介绍
联合分析是用来发掘消费者的偏好,指出了消费者将选择购买哪种组合(联合分析相关内容具体请参考上一文章介绍:SAS市场研究应用介绍:组合/联合分析)。在市场研究中,消费者实际做的选择是一种利益行为,那么用离散选择分析方法来直接分析消费者的选择是明智的,即离散选择法的目标是通过(特定个体的或者特定类别的)协变量解释所观察到的在离散对象中进行的抉择。
离散选择分析(模型),也叫做基于选择的结合分析模型(Choice-Based Conjoint Analysis),是一种非常有效且实用的技术,也是SAS市场研究模块中常用的一种技术方法。该模型是在实验设计的基础上,通过模拟所要研究产品/服务的市场竞争环境,来测量消费者的购买行为,从而获知消费者如何在不同产品/服务属性水平和价格条件下进行选择。这种技术可广泛应用于新产品开发、市场占有率分析、品牌竞争分析、市场细分和价格策略等市场营销领域。同时离散选择分析/模型也是一种处理离散的、非线性的定性数据的复杂高级多元统计分析技术,它采用Multinomial Logit Model进行数据分析。
二、离散选择分析/模型的基本概念和原理
离散选择模型主要用于测量消费者在实际或模拟的市场竞争环境下如何在不同产品/服务中进行选择,是市场研究领域中较为常见的一种研究方法。通常是在正交实验设计的基础上,构造一定数量的产品/服务选择集(Choice Set),每个选择集包括多个产品/服务的轮廓(Profile),每一个轮廓是由能够描述产品/服务重要特征的属性(Attributes)以及赋予每一个属性的不同水平(Level)组合构成。例如消费者购买手机的重要属性和水平可能包括:品牌(A,B,C)、价格(1500元,1750万元,2000元)、功能(短信,短信语音,图片短信)等,离散选择模型是测量消费者在给出不同的产品价格、功能条件下是选择购买品牌A,还是品牌B或者品牌C,还是什么都不选择。
离散选择模型的一个重要的假定是:消费者是根据构成产品/服务的多个属性来进行理解和作选择判断;另一个基本假定是:消费者的选择行为要比偏好行为更接近现实情况。
它与传统的全轮廓结合分析(Full Profiles Conjoint Analysis)都是在全轮廓的基础上采用分解的方法测量消费者对某一轮廓(产品)的选择与偏好,对构成该轮廓的多个属性和水平的选择与偏好,用效用值(Utilities)来描述。但是,它与传统的结合分析的最大区别在于:离散选择模型不是测量消费者的偏好,而是获知消费者如何在不同竞争产品选择集中进行选择。
因此,离散选择模型在市场研究之价格研究中是一种更为实际、更有效、也更复杂的技术。具体表现在:
l 将消费者的选择置于模拟的竞争市场环境,“选择”更接近消费者的实际购买行为;消费者的选择行为要比偏好态度更能反映产品不同属性和水平的价值,也更具有针对性;
l 消费者只需做出“买”或“不买”的回答,数据获得更容易,也更准确;
l 消费者可以做出“任何产品都不购买”的决策,这与现实是一致的;
l 实验设计可以排除不合理的产品组合,同时可以分析产品属性水平存在交互作用的情况;
l 离散选择集能够较好地处理产品属性水平个数(大于4)较多的情况;
l 统计分析模型和数据结构更为复杂,但可以模拟更广泛的市场竞争环境;
l 模型分析是在消费者群体层面,而非个体层面。
离散选择模型主要采用离散的、非线性的Multinomial Logit统计分析技术,其因变量是消费者在多个可选产品中,选择购买哪一种产品;而自变量是构成选择集的不同产品属性。
三、离散选择模型的主要步骤
任何一项采用离散选择模型进行的市场研究,都包括从确定研究目的、实验设计、数据收集、数据整理、数据分析和计算、检验与应用、模拟市场、撰写研究报告等全过程,必须借助专用的分析软件来实现。
采用离散选择模型的主要步骤如下:
属性和水平的确定
离散选择模型最重要的一步就是决定能描述产品/服务特征的重要属性。针对不同的研究目的,影响消费者选择购买或使用产品/服务的因素都要考虑。
选择集实验设计
当产品/服务的属性和水平数目不太多时可以将所有的产品/服务组合展现给消费者,即采用全因子实验设计(Full-Factorial Design),这种设计可以估计属性间的主效应(Main Effect),以及估计交互作用。
问卷设计和数据收集
离散选择模型是将产品/服务轮廓的属性水平组合成m种不同产品/服务,构造一个选择集,同时展现给消费者,从中选择一个最可能购买的产品/服务。也可以让消费者评价多个选择集,每个选择集可以包括“在该选择集中,任何产品都不购买”的选择,这样更接近现实情况。
数据编码和整理
离散选择模型对选择集的数据格式有特殊的要求,在进行数据分析之前必须将所有选择集进行重新编码,并与被访者的“选择”结果合并数据。
数据分析
离散选择模型是在消费者群体层面上进行分析,它主要包括两个方面,(1)选择频次分析:通过分析所有被访者对选择集中可选产品的选择频次,得到各属性水平的选择比率,也可以计算不同属性水平二维交互作用的选择比率,一般用百分比表示。(2)Logit模型选择概率分析:当选择数据经过编码整合后,就可以利用Multinomial Logit Model进行数据分析。该模型是一种复杂的多元统计分析过程,前面提到的SAS/STAT和Market模块的Prco PHREG过程可以用来估计未知参数向量
,并计算不同选择集中每个产品的选择概率。
结果检验和解释
离散选择模型的Multinomial Logit选择概率分析,主要是获得未知参数
估计值。参数估计值表明各属性的不同水平影响消费者选择某种产品/服务特征的价值或优先选择的程度,一般用“效用值”表示。效用值越大表明消费者越会首选具有该水平的产品/服务。
应用结果和模拟市场
离散选择模型可以在群体层面上得到影响消费者选择购买或使用产品/服务的属性水平的效用值,进而可以模拟市场竞争环境,构造不同选择集,计算选择频次比率和选择概率,获得消费者在不同产品/服务属性水平下的选择行为。可广泛应用于新产品开发、市场占有率分析、品牌竞争分析、市场细分和价格策略等市场研究领域。
三 、利用SAS应用:离散选择分析
注意的假设
在市场研究中常用于哪些
与一组实行安慰剂治疗的对照组(Control group)进行比较,看治疗方法是否成功
解释妇女的工作行为
选择某一专业学习
在一揽子商品中对某一商品的购买决策 (市场研究)
情景条件下的市场份额建模
根据“回忆者”(表现出来)的特征衡量广告活动的成功
解释顾客价值概念(分类模型)
顾客满意度研究(分类模型)
SAS自带数据集案例操作
这里我们选取一个SAS案例中数据应用来演示下,在离散选择分析中,被访者将对几种方案作出选择。影响选择的一些因素叫做“选择属性”(就像组合分析中的属性一样)。每种可能的选择叫做“选择设定”。
以sasuser中的price为例说明软件的使用:SAS->解决方案->市场研究->找到对应的数据集
选择price数据集,分析方法选择discrete choice analysis,ok后进入一个补充界面,提示数据集形式是否正确,可以点击examine,看数据集是否如其所显示的格式,如果不是则要重新将数据布局。
点击OK后进入变量界面,将要选择布置如下变量:一个因变量(response)、若干选择属性变量(choice)、一个测试变量(subject variable)。也可以选择一个频率变量(frequency)和若干非选择属性变量(non-choice variable),如果选择了频率变量,测试变量可以不必。
此例中,choose作为因变量,并点开下方的箭头,将1选入(1代表选择,0代表不选择)。选择price,band1,band2…band4作为选择属性变量(band5之所以不选,是因为band是一个虚拟变量)。Fre作为频率变量,频率变量记录了做出选择的数目。Set作为选择设定变量(choice set),点击OK。
结果显示band4,band1,price和band2对选择很重要。想了解更多结果,可以从结果菜单中选择“统计量”,“选中概率”来查看属性的系数估计和模型拟合情况,以及每种方案被选择的概率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23很多数据分析师每天盯着GMV、DAU、转化率,但当被问到“哪些指标是所有企业都需要的”“哪些指标是因行业而异的”“北极星指标和 ...
2026-04-23在数字化时代,客户每一次点击、浏览、下单、咨询等行为,都在传递其潜在需求与决策倾向——这些按时间顺序串联的行为轨迹,构成 ...
2026-04-22数据是数据分析、建模与业务决策的核心基石,而“数据清洗”作为数据预处理的核心环节,是打通数据从“原始杂乱”到“干净可用” ...
2026-04-22