
SAS市场研究应用介绍:离散选择分析
一、离散选择分析(discrete choice analysis)介绍
联合分析是用来发掘消费者的偏好,指出了消费者将选择购买哪种组合(联合分析相关内容具体请参考上一文章介绍:SAS市场研究应用介绍:组合/联合分析)。在市场研究中,消费者实际做的选择是一种利益行为,那么用离散选择分析方法来直接分析消费者的选择是明智的,即离散选择法的目标是通过(特定个体的或者特定类别的)协变量解释所观察到的在离散对象中进行的抉择。
离散选择分析(模型),也叫做基于选择的结合分析模型(Choice-Based Conjoint Analysis),是一种非常有效且实用的技术,也是SAS市场研究模块中常用的一种技术方法。该模型是在实验设计的基础上,通过模拟所要研究产品/服务的市场竞争环境,来测量消费者的购买行为,从而获知消费者如何在不同产品/服务属性水平和价格条件下进行选择。这种技术可广泛应用于新产品开发、市场占有率分析、品牌竞争分析、市场细分和价格策略等市场营销领域。同时离散选择分析/模型也是一种处理离散的、非线性的定性数据的复杂高级多元统计分析技术,它采用Multinomial Logit Model进行数据分析。
二、离散选择分析/模型的基本概念和原理
离散选择模型主要用于测量消费者在实际或模拟的市场竞争环境下如何在不同产品/服务中进行选择,是市场研究领域中较为常见的一种研究方法。通常是在正交实验设计的基础上,构造一定数量的产品/服务选择集(Choice Set),每个选择集包括多个产品/服务的轮廓(Profile),每一个轮廓是由能够描述产品/服务重要特征的属性(Attributes)以及赋予每一个属性的不同水平(Level)组合构成。例如消费者购买手机的重要属性和水平可能包括:品牌(A,B,C)、价格(1500元,1750万元,2000元)、功能(短信,短信语音,图片短信)等,离散选择模型是测量消费者在给出不同的产品价格、功能条件下是选择购买品牌A,还是品牌B或者品牌C,还是什么都不选择。
离散选择模型的一个重要的假定是:消费者是根据构成产品/服务的多个属性来进行理解和作选择判断;另一个基本假定是:消费者的选择行为要比偏好行为更接近现实情况。
它与传统的全轮廓结合分析(Full Profiles Conjoint Analysis)都是在全轮廓的基础上采用分解的方法测量消费者对某一轮廓(产品)的选择与偏好,对构成该轮廓的多个属性和水平的选择与偏好,用效用值(Utilities)来描述。但是,它与传统的结合分析的最大区别在于:离散选择模型不是测量消费者的偏好,而是获知消费者如何在不同竞争产品选择集中进行选择。
因此,离散选择模型在市场研究之价格研究中是一种更为实际、更有效、也更复杂的技术。具体表现在:
l 将消费者的选择置于模拟的竞争市场环境,“选择”更接近消费者的实际购买行为;消费者的选择行为要比偏好态度更能反映产品不同属性和水平的价值,也更具有针对性;
l 消费者只需做出“买”或“不买”的回答,数据获得更容易,也更准确;
l 消费者可以做出“任何产品都不购买”的决策,这与现实是一致的;
l 实验设计可以排除不合理的产品组合,同时可以分析产品属性水平存在交互作用的情况;
l 离散选择集能够较好地处理产品属性水平个数(大于4)较多的情况;
l 统计分析模型和数据结构更为复杂,但可以模拟更广泛的市场竞争环境;
l 模型分析是在消费者群体层面,而非个体层面。
离散选择模型主要采用离散的、非线性的Multinomial Logit统计分析技术,其因变量是消费者在多个可选产品中,选择购买哪一种产品;而自变量是构成选择集的不同产品属性。
三、离散选择模型的主要步骤
任何一项采用离散选择模型进行的市场研究,都包括从确定研究目的、实验设计、数据收集、数据整理、数据分析和计算、检验与应用、模拟市场、撰写研究报告等全过程,必须借助专用的分析软件来实现。
采用离散选择模型的主要步骤如下:
属性和水平的确定
离散选择模型最重要的一步就是决定能描述产品/服务特征的重要属性。针对不同的研究目的,影响消费者选择购买或使用产品/服务的因素都要考虑。
选择集实验设计
当产品/服务的属性和水平数目不太多时可以将所有的产品/服务组合展现给消费者,即采用全因子实验设计(Full-Factorial Design),这种设计可以估计属性间的主效应(Main Effect),以及估计交互作用。
问卷设计和数据收集
离散选择模型是将产品/服务轮廓的属性水平组合成m种不同产品/服务,构造一个选择集,同时展现给消费者,从中选择一个最可能购买的产品/服务。也可以让消费者评价多个选择集,每个选择集可以包括“在该选择集中,任何产品都不购买”的选择,这样更接近现实情况。
数据编码和整理
离散选择模型对选择集的数据格式有特殊的要求,在进行数据分析之前必须将所有选择集进行重新编码,并与被访者的“选择”结果合并数据。
数据分析
离散选择模型是在消费者群体层面上进行分析,它主要包括两个方面,(1)选择频次分析:通过分析所有被访者对选择集中可选产品的选择频次,得到各属性水平的选择比率,也可以计算不同属性水平二维交互作用的选择比率,一般用百分比表示。(2)Logit模型选择概率分析:当选择数据经过编码整合后,就可以利用Multinomial Logit Model进行数据分析。该模型是一种复杂的多元统计分析过程,前面提到的SAS/STAT和Market模块的Prco PHREG过程可以用来估计未知参数向量,并计算不同选择集中每个产品的选择概率。
结果检验和解释
离散选择模型的Multinomial Logit选择概率分析,主要是获得未知参数估计值。参数估计值表明各属性的不同水平影响消费者选择某种产品/服务特征的价值或优先选择的程度,一般用“效用值”表示。效用值越大表明消费者越会首选具有该水平的产品/服务。
应用结果和模拟市场
离散选择模型可以在群体层面上得到影响消费者选择购买或使用产品/服务的属性水平的效用值,进而可以模拟市场竞争环境,构造不同选择集,计算选择频次比率和选择概率,获得消费者在不同产品/服务属性水平下的选择行为。可广泛应用于新产品开发、市场占有率分析、品牌竞争分析、市场细分和价格策略等市场研究领域。
三 、利用SAS应用:离散选择分析
注意的假设
在市场研究中常用于哪些
与一组实行安慰剂治疗的对照组(Control group)进行比较,看治疗方法是否成功
解释妇女的工作行为
选择某一专业学习
在一揽子商品中对某一商品的购买决策 (市场研究)
情景条件下的市场份额建模
根据“回忆者”(表现出来)的特征衡量广告活动的成功
解释顾客价值概念(分类模型)
顾客满意度研究(分类模型)
SAS自带数据集案例操作
这里我们选取一个SAS案例中数据应用来演示下,在离散选择分析中,被访者将对几种方案作出选择。影响选择的一些因素叫做“选择属性”(就像组合分析中的属性一样)。每种可能的选择叫做“选择设定”。
以sasuser中的price为例说明软件的使用:SAS->解决方案->市场研究->找到对应的数据集
选择price数据集,分析方法选择discrete choice analysis,ok后进入一个补充界面,提示数据集形式是否正确,可以点击examine,看数据集是否如其所显示的格式,如果不是则要重新将数据布局。
点击OK后进入变量界面,将要选择布置如下变量:一个因变量(response)、若干选择属性变量(choice)、一个测试变量(subject variable)。也可以选择一个频率变量(frequency)和若干非选择属性变量(non-choice variable),如果选择了频率变量,测试变量可以不必。
此例中,choose作为因变量,并点开下方的箭头,将1选入(1代表选择,0代表不选择)。选择price,band1,band2…band4作为选择属性变量(band5之所以不选,是因为band是一个虚拟变量)。Fre作为频率变量,频率变量记录了做出选择的数目。Set作为选择设定变量(choice set),点击OK。
结果显示band4,band1,price和band2对选择很重要。想了解更多结果,可以从结果菜单中选择“统计量”,“选中概率”来查看属性的系数估计和模型拟合情况,以及每种方案被选择的概率。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22在企业数据分析中,“数据孤岛” 是制约分析深度的核心瓶颈 —— 用户数据散落在注册系统、APP 日志、客服记录中,订单数据分散 ...
2025-10-22在神经网络设计中,“隐藏层个数” 是决定模型能力的关键参数 —— 太少会导致 “欠拟合”(模型无法捕捉复杂数据规律,如用单隐 ...
2025-10-21在特征工程流程中,“单变量筛选” 是承上启下的关键步骤 —— 它通过分析单个特征与目标变量的关联强度,剔除无意义、冗余的特 ...
2025-10-21在数据分析全流程中,“数据读取” 常被误解为 “简单的文件打开”—— 双击 Excel、执行基础 SQL 查询即可完成。但对 CDA(Cert ...
2025-10-21在实际业务数据分析中,我们遇到的大多数数据并非理想的正态分布 —— 电商平台的用户消费金额(少数用户单次消费上万元,多数集 ...
2025-10-20在数字化交互中,用户的每一次操作 —— 从电商平台的 “浏览商品→加入购物车→查看评价→放弃下单”,到内容 APP 的 “点击短 ...
2025-10-20在数据分析的全流程中,“数据采集” 是最基础也最关键的环节 —— 如同烹饪前需备好新鲜食材,若采集的数据不完整、不准确或不 ...
2025-10-20在数据成为新时代“石油”的今天,几乎每个职场人都在焦虑: “为什么别人能用数据驱动决策、升职加薪,而我面对Excel表格却无从 ...
2025-10-18数据清洗是 “数据价值挖掘的前置关卡”—— 其核心目标是 “去除噪声、修正错误、规范格式”,但前提是不破坏数据的真实业务含 ...
2025-10-17在数据汇总分析中,透视表凭借灵活的字段重组能力成为核心工具,但原始透视表仅能呈现数值结果,缺乏对数据背景、异常原因或业务 ...
2025-10-17在企业管理中,“凭经验定策略” 的传统模式正逐渐失效 —— 金融机构靠 “研究员主观判断” 选股可能错失收益,电商靠 “运营拍 ...
2025-10-17在数据库日常操作中,INSERT INTO SELECT是实现 “批量数据迁移” 的核心 SQL 语句 —— 它能直接将一个表(或查询结果集)的数 ...
2025-10-16在机器学习建模中,“参数” 是决定模型效果的关键变量 —— 无论是线性回归的系数、随机森林的树深度,还是神经网络的权重,这 ...
2025-10-16在数字化浪潮中,“数据” 已从 “辅助决策的工具” 升级为 “驱动业务的核心资产”—— 电商平台靠用户行为数据优化推荐算法, ...
2025-10-16在大模型从实验室走向生产环境的过程中,“稳定性” 是决定其能否实用的关键 —— 一个在单轮测试中表现优异的模型,若在高并发 ...
2025-10-15