 京公网安备 11010802034615号
			经营许可证编号:京B2-20210330
 京公网安备 11010802034615号
			经营许可证编号:京B2-20210330
		调研问卷中多选题的分析方法探讨
	
使用调研问卷的定量研究中,为了更全面地了解研究内容、更广泛地收集信息,经常会用到多选题,但由于多选题多指向性的特点,除了频数表和交叉表(只能与单选题做交叉),较少用到其他的分析方法,损失了很多有用的信息。其实,如果调研时能善用多选题,并在分析时选取适当的方法,就能够充分利用多选题包含的信息,得到更有价值的结论。
前两篇文章分别谈到调研问卷中带有分类性质的多选题、带有求和性质的多选题如何进行分析,本文将侧重说一下带有递进逻辑的多选题如何进行深入分析。
带有递进逻辑的多选题
问卷调研中,常会通过多选题考察用户在某个方面不同层次的情况,如对某个卖家产品各功能的使用情况(经常使用的功能)、使用的满意情况(满意的功能)、需要改进的情况(亟需改进的功能)等,题目与题目之间是同一个问题的不同层次,存在递进的逻辑关系,即使用频率高低与是否满意、是否亟需等,三者之间分别存在逻辑关系。
此时,这种存在递进逻辑的多选题,可以首先考察不同题目相同选项之间的相关性;其次,能够衍生出新的题目,进行深入分析,挖掘表面背后的原因。
其实,这种带有递进逻辑的多选题,可以采用量表的形式进行考察,而量表题涉及到N级量表,相当于每个项目(选项)都是一个题目,具有递进逻辑的项目之间,进行相关分析、衍生变量分析,更能深入挖掘用户在某一方面的综合情况。只是为了节约用户的填答成本,常用多选题代替。
另外,衍生出的新题目,也是可以通过直接询问的方式获得的,但通常题目带有递进逻辑时,需要用户深入全面思考,耗费的精力较大,也容易造成理解上的偏差,给研究结论带来较大的非抽样误差。因此,通过多个简单的题目,计算出带有递进逻辑的结果,更易行更有效。
带有递进逻辑的多选题一般具备以下几个特征:
1、题目与题目之间的递进逻辑存在分析价值,如对某个卖家产品各功能的考察中,卖家对产品功能是否满意与是否亟需改进之间的递进关系,对于产品改进的方向、改进的优先级等有较大的参考价值。如果是满意但亟需改进,表明该功能可能需要创新;若不满意但没有亟需改进,则说明该功能的改进优先级可以适当靠后。
		2、相关题目之间的选项相同,选项若不对应,或部分对应,会造成递进逻辑关系不紧密,容易引起结果出现偏差。
会有特殊情况,如某产品经常使用的功能选项,除主要功能外,还有一个互斥的选项“不常用以上功能”;亟需改进的功能选项,除主要功能外,也有一个互斥的选项“均不需要改进”。这类情况中,题目多出来的互斥选项只是为了解决题目设置为必选时,满足某种特殊情况,主要功能仍然是一一对应的,不对应的互斥选项,后续不进入递进关系的分析。
	
3、相关题目的选项尽可能覆盖全面,选项尽量能够覆盖考察的主要细节点,以免用户过多地选择“其他”选项,削弱了分析递进关系的可能性。
4、相关题目的选项个数最好超过3个,如果选项只有3个或更少,将多选题改为量表题,用户的填答成本不太大,获得的信息会更多,后续利用递进关系进行分析时,可以更加深入。
5、相关题目设置限选时需考虑递进逻辑,若同时限选,限选的个数最好相同;由于递进关系通常是由弱到强,有时可以设置递进关系较弱的题目不限选,较强的题目限选,如满意的功能不限选,亟需改进的功能限选,可以分析递进关系中的强度。但如果递进关系较弱的题目限选,而递进关系较强的题目不限选,则容易造成解读上的偏差,带来不必要的麻烦。
6、数据为0/1格式,即每个选项一个变量,选中为1,未选中为0,多选题转换成此种格式,宜于做深入分析。
当调研问卷中设置了带有递进逻辑的多选题,就可以采用下文介绍的方法进行深入分析。
		本文中的例子,采用年初时自主发起的《卖家旺铺选择研究》,研究中涉及两套递进关系的题目:
您目前已经在用的旺铺功能有哪些?(可多选)
您目前最需要的旺铺功能有哪些?(可多选,最多9项)
您目前使用旺铺主要解决了哪些问题?(可多选)
您最希望通过旺铺帮您解决哪些问题?(可多选,最多6项)
	
相关分析
		本文的案例主要研究旺铺,根据版本分析更有价值。以使用拓展版旺铺的用户为例,分别计算已经在用的功能和最需要的功能,再对每一个功能在用的和最需要的变量做相关分析,能够得到如下结论(详见下图,数字略):
 
	
1、已经在用的高比例,同时最需要的也是高比例的功能,对于拓展版旺铺而言,是需要维持的功能。
2、需要维持的功能中,个性化店招、数据分析工具、宝贝30天销售量累积显示、自定义页面布局等功能,在用的与最需要的之间存在显著相关(图中已星号标注,*代表显著相关,**代表非常显著相关),从一个侧面表明,已经在用的用户尤为需要这些功能;而其中没有显著相关的功能,则不能得出这样的结论。
3、已经在用的比例不高,而最需要的比例较高的功能,对于拓展版旺铺而言,是需要加强的功能。
4、需要加强的功能中,营销工具组合、不限类型的旺铺装修模板等功能,在用的与最需要的之间存在显著相关,从一个侧面表明,已经在用的用户对这两个功能的期望较高,也特别需要这两个功能。
5、另外,从具体数据上可以看出,虽然拓展版用户已经在用高级发货、进销存管理、客户关系管理等功能的比例不高,但最需要这三个功能的比例远超过在用的比例,表明部分拓展版用户对这三个功能的需求很旺盛。而这三个功能是旗舰版的功能,反映了这部分用户应该选择更高版本的旺铺。
注:虽然高级版本的旺铺中包含一些特有的功能,但这些功能附属的工具可以单独购买,所以,会出现使用低版本旺铺的用户,已经在用某些高版本的功能。情况相对复杂,分析时需要注意,下文雷同,不再赘述。
衍生变量分析
以使用扶植版旺铺的用户为例,因为“目前使用旺铺解决了的问题”与“最希望通过旺铺帮助解决的问题”存在递进逻辑关系,可以衍生出两个比较关键的变量,即已经解决了且希望解决的问题、尚未解决但希望解决的问题。
		有了这两个变量,可以更加深入地分析,希望解决的问题具体情况是怎样的,最终分析结论如下(详见下图,数字略):
 
	
1、提升店铺的流量、增加店铺的可信度、增加店铺的专业程度等,是使用扶植版旺铺的用户非常关注的问题,不论目前是否解决,都非常希望通过旺铺解决,表明这三方面是需要维持的利益点,也是宣传扶植版旺铺的重点。
2、装修更便利、店铺更美观等,是目前解决了,但仍希望通过旺铺解决的问题,表明这部分使用扶植版旺铺的用户,对装修的便利性、装修效果等更重视,希望能做到更好,可以对他们做相应的培训,或直接向他们推荐装修更灵活、呈现更多样的高版本旺铺。(之所以得到这样的结论,主要是因为最希望通过旺铺解决的问题是多选限选,可以根据以往研究经验,假设需求强度不大,已经解决了,就不会再选了。)
3、提升宝贝的转化率/成交量、增加宝贝的点击率、增加买家在店铺的停留时长等,是目前尚未解决,但希望能够通过旺铺解决的问题,表明这部分扶植版旺铺的用户比较直接、实际,非常看重流量和销量,可以对他们做相应的指导,也可推荐引流量的工具或服务。
利用衍生变量深入分析
本研究中在询问功能和解决的问题时,将多个版本的内容融合在一起,后续分析时,可以分析出目前使用某个版本的用户,目前是否适合当前版本,如果不适合,如何引导他们使用更适合的版本;如果适合,是否已经用得足够好,用得不好,如何帮助他们。这些疑问,可以利用衍生变量进行深入分析,从而得到答案。
以使用标准版旺铺的用户为例,首先要明确四个前提步骤:
Step1、由于功能和解决的问题是多个版本融合在一起,需要分清哪些功能是当前版本的,哪些是更高版本才有的,旺铺的高版本兼具低版本的功能。
		Step2、分析中需要结合旺铺版本,衍生出一个变量,叫做“更适合的功能点”,即目前未使用,但最需要的功能,且这个功能又是更高版本的旺铺功能;
还需要衍生出另一个变量,叫做“未用好的功能点”,即目前未使用,但最需要的功能,且这个功能是当前版本具备的旺铺功能。
	
		Step3、以往的定性调研表明,一个使用低版本旺铺的用户之所以选择更高版本,往往是看上了高版本的其中一个功能,如宝贝30天销量累积显示。
本例在判断部分使用当前版本的用户,实际上适合更高版本旺铺时,采用了保守的方式,找出前提2中排名前三位的“更适合的功能点”,取平均值,把它当做更适合高版本旺铺的当前版本用户的比例。主要基于假设,这些功能对他们相当重要,理想状态下,后续他们会因为这些功能转用高版本旺铺。
同样,适合但未用好当前版本的用户,也采用了类似的方式计算比例,此不赘述。
	
Step4、若判定部分当前版本用户适合更高版本旺铺,还需要有促使他们转换的利益点,这些利益点也可以由衍生变量得到,即目前使用旺铺未解决但最希望通过旺铺解决的问题。
		 
	
也可以找出适合当前版本但未用好的比例,摸清哪些功能点他们没有用好,能够更有针对性地培训,使其充分发挥旺铺的功能。
小结
综上所述,带有递进逻辑的多选题,分析的流程如下:
1、确定在设计问卷时,是否包含递进逻辑的多选题,并确保题目的递进关系存在解读价值、应用价值;
2、根据题目的特点,衍生出新的变量;
3、根据衍生变量的统计量,深入分析样本的相关情况;
4、可以根据其他关键变量(如旺铺版本、星级等)对衍生变量做进一步分析,从而得出更深入的研究结论。
 
                  数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在 MySQL 实际应用中,“频繁写入同一表” 是常见场景 —— 如实时日志存储(用户操作日志、系统运行日志)、高频交易记录(支付 ...
2025-10-30为帮助教育工作者、研究者科学分析 “班级规模” 与 “平均成绩” 的关联关系,我将从相关系数的核心定义与类型切入,详解 “数 ...
2025-10-30对 CDA(Certified Data Analyst)数据分析师而言,“相关系数” 不是简单的数字计算,而是 “从业务问题出发,量化变量间关联强 ...
2025-10-30在构建前向神经网络(Feedforward Neural Network,简称 FNN)时,“隐藏层数目设多少?每个隐藏层该放多少个神经元?” 是每个 ...
2025-10-29这个问题切中了 Excel 用户的常见困惑 —— 将 “数据可视化工具” 与 “数据挖掘算法” 的功能边界混淆。核心结论是:Excel 透 ...
2025-10-29在 CDA(Certified Data Analyst)数据分析师的工作中,“多组数据差异验证” 是高频需求 —— 例如 “3 家门店的销售额是否有显 ...
2025-10-29在数据分析中,“正态分布” 是许多统计方法(如 t 检验、方差分析、线性回归)的核心假设 —— 数据符合正态分布时,统计检验的 ...
2025-10-28箱线图(Box Plot)作为展示数据分布的核心统计图表,能直观呈现数据的中位数、四分位数、离散程度与异常值,是质量控制、实验分 ...
2025-10-28在 CDA(Certified Data Analyst)数据分析师的工作中,“分类变量关联分析” 是高频需求 —— 例如 “用户性别是否影响支付方式 ...
2025-10-28在数据可视化领域,单一图表往往难以承载多维度信息 —— 力导向图擅长展现节点间的关联结构与空间分布,却无法直观呈现 “流量 ...
2025-10-27这个问题问到了 Tableau 中两个核心行级函数的经典组合,理解它能帮你快速实现 “相对位置占比” 的分析需求。“index ()/size ( ...
2025-10-27对 CDA(Certified Data Analyst)数据分析师而言,“假设检验” 绝非 “套用统计公式的机械操作”,而是 “将模糊的业务猜想转 ...
2025-10-27在数字化运营中,“凭感觉做决策” 早已成为过去式 —— 运营指标作为业务增长的 “晴雨表” 与 “导航仪”,直接决定了运营动作 ...
2025-10-24在卷积神经网络(CNN)的训练中,“卷积层(Conv)后是否添加归一化(如 BN、LN)和激活函数(如 ReLU、GELU)” 是每个开发者都 ...
2025-10-24在数据决策链条中,“统计分析” 是挖掘数据规律的核心,“可视化” 是呈现规律的桥梁 ——CDA(Certified Data Analyst)数据分 ...
2025-10-24在 “神经网络与卡尔曼滤波融合” 的理论基础上,Python 凭借其丰富的科学计算库(NumPy、FilterPy)、深度学习框架(PyTorch、T ...
2025-10-23在工业控制、自动驾驶、机器人导航、气象预测等领域,“状态估计” 是核心任务 —— 即从含噪声的观测数据中,精准推断系统的真 ...
2025-10-23在数据分析全流程中,“数据清洗” 恰似烹饪前的食材处理:若食材(数据)腐烂变质、混杂异物(脏数据),即便拥有精湛的烹饪技 ...
2025-10-23在人工智能领域,“大模型” 已成为近年来的热点标签:从参数超 1750 亿的 GPT-3,到万亿级参数的 PaLM,再到多模态大模型 GPT-4 ...
2025-10-22在 MySQL 数据库的日常运维与开发中,“更新数据是否会影响读数据” 是一个高频疑问。这个问题的答案并非简单的 “是” 或 “否 ...
2025-10-22