京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS详细教程:OR值的计算
一、问题与数据
研究者想要探索人群中不同性别者喜欢竞技类或娱乐性体育活动是否有差异。研究者从学习运动医学的学生中随机招募50名学生,记录性别并询问他们喜欢竞技类还是娱乐性活动,通过计算比值比来探索这一差异。
性别变量为gender,男性赋值为1,女性赋值为2;喜欢竞技类运动的变量为comp,是赋值为1,否(即喜欢休闲类运动)赋值为2。部分数据如下图显示,左图为原始数据,右图为按性别和喜欢竞技类运动与否统计的汇总数据。
二、对问题的分析
为计算比值比,需要满足以下两个假设:
1. 假设1:自变量和因变量均为二分类变量。
2. 假设2:观测间相互独立。
接下来,将介绍计算比值比的SPSS操作。
三、SPSS操作
1. 数据准备
如果研究者使用原始数据,跳过数据准备步骤,直接计算比值比;如果使用按性别和喜欢竞技类运动与否统计的汇总数据,则需要添加权重,步骤如下。
(1)点击主菜单Data > Weight Cases,如下图:
点击后出现Weight Cases对话框,如下图:
(2)勾选Weight cases by选项,激活 键和Frequency Variable: 框,如下图:
(3)将变量freq选入Frequency Variable框,如下图:
(4)点击OK键,为数据加权。
2. 比值比的SPSS操作
(1)点击主菜单Analyze > Descriptive Statistics > Crosstabs,如下图:
点击后出现Crosstabs对话框,如下图:
注意:如果使用频数统计的数据文件,Crosstabs对话框如下图:
(2)将自变量gender选入Row(s):框,因变量comp选入Column(s):框,如下图:
注意:如果使用频数统计的数据文件,Crosstabs对话框如下图:
(3)点击Statistics键,出现Crosstabs Statistics对话框,如下图:
(4)勾选Risk,如下图:
(5)点击Continue键。
(6)点击OK键,生成结果。
四、结果解释
1. 描述性分析
在报告比值比前,研究者应该先查看基本的一些统计量,了解数据特征。本例查看gender*comp Crosstabulation表,如下图:
表中可看到50名研究对象中男性和女性各25人。首先,查看男性喜欢竞技类运动的比值,如下图高亮显示:
25名男性中,18名男性喜欢竞技类运动,7名不喜欢(即喜欢娱乐性运动)。因此,男性喜欢竞技类运动的比值为喜欢与不喜欢的概率之比,即为喜欢竞技类运动的男性数量除以不喜欢的男性数量,得到比值为2.57(18÷7=2.57)。因此对男性来讲,喜欢竞技类运动的概率是喜欢娱乐性运动概率的两倍多。
同理,也可以得到女性的比值。下表中为25名女性喜欢竞技类运动的情况:
25名女性中10名喜欢竞技类运动,15名不喜欢。因此女性喜欢竞技类运动的比值为为喜欢竞技类运动的女性数量除以不喜欢的女性数量,得到比值为0.67(10÷15=0.67)。因此对女性来讲,喜欢竞技类运动的概率是喜欢娱乐性运动概率的0.67倍。
因此,研究者可以汇报:“本研究招募了50名研究对象,男女性各25人。与娱乐性运动(n=7)相比,男性更喜欢竞技类运动(n=18);在女性中则相反,10名女性喜欢竞技类运动、15名女性喜欢娱乐性运动”。
2. 比值比
观察Risk Estimate表可以得到比值比,如下图:
性别与喜欢竞技类运动与否的比值比为3.857,95%置信区间为1.180到12.606。95%置信区间代表研究者有95%的把握确定人群中这一关联的真实比值比在1.180到12.606之间。此外,比值比还可以通过gender*comp Cross tabulation表的两个比值手动算出。
计算性别与喜欢竞技类运动与否的比值比,仅需要用男性的比值除以女性的比值,如下面算式。因此,男性喜欢竞技类运动的可能性是女性3.857倍。
如果比值比大于1且95%置信区间不包括1,代表男性喜欢竞技类运动的可能性大于女性;反之,比值比小于1且95%置信区间不包括1,则代表男性喜欢竞技类运动的可能性小于女性;若比值比的95%置信区间包括1,则说明男女性喜欢竞技类运动的可能性无统计学差异。
五、撰写结论
本研究招募了50名研究对象,男女性各25人。与娱乐性运动(n=7)相比,男性更喜欢竞技类运动(n=18);在女性中则相反,10名女性喜欢竞技类运动、15名女性喜欢娱乐性运动。与女性相比,男性喜欢竞技类运动的比值比是3.857(95%置信区间:1.180-12.606),且有统计学意义。
CDA学员免费下载查看报告全文:2026全球数智化人才指数报告【CDA数据科学研究院】.pdf
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在数字化时代,商业竞争的核心已从“经验驱动”转向“数据驱动”,越来越多的企业意识到,商业分析不是简单的数据统计与报表呈现 ...
2026-05-06在Excel数据透视表的实操中,“引用”是连接透视表与公式、辅助数据的核心操作,而相对引用作为最基础、最常用的引用方式,其设 ...
2026-05-06 很多数据分析师做过按月份的销售额趋势图,画过按天的流量折线图,但当被问到“时间序列和普通数据有什么本质区别”“季节性 ...
2026-05-06在Excel数据分析中,数据透视表是汇总、整理海量数据的高效工具,而公式则是实现数据二次计算、逻辑判断的核心功能。实际操作中 ...
2026-04-30Excel透视图是数据分析中不可或缺的工具,它能将透视表中的数据快速可视化,帮助我们直观捕捉数据规律、呈现分析结果。但在实际 ...
2026-04-30 很多数据分析师能熟练地计算指标、搭建标签体系,但当被问到“画像到底在解决什么问题”“画像和标签是什么关系”“画像如何 ...
2026-04-30在中介效应分析中,人口统计学变量(如年龄、性别、学历、收入、职业等)是常见的控制变量或调节变量,其处理方式直接影响分析结 ...
2026-04-29在SQL数据库实操中,日期数据的存储与显示是高频需求,而“数字日期”(如20240520、20241231、45321)是很多开发者、数据分析师 ...
2026-04-29 很多分析师在设计标签时思路清晰,但真到落地环节却面临“数据在手,不知如何转化为可用标签”的困境:或因加工方式选择不当 ...
2026-04-29在手游行业竞争日趋白热化的当下,“流量为王”早已升级为“留存为王”,而付费用户留存率更是衡量一款手游盈利能力、运营质量的 ...
2026-04-28在日常MySQL数据库运维与开发中,经常会遇到“同一台服务器上,两个不同数据库(以下简称“源库”“目标库”)的表数据需要保持 ...
2026-04-28 很多分析师每天和数据打交道,但当被问到“标签是什么”“标签和指标有什么区别”“标签体系如何设计”时,却常常答不上来。 ...
2026-04-28箱线图(Box Plot)作为一种经典的数据可视化工具,广泛应用于统计学、数据分析、科研实证等领域,核心价值在于直观呈现数据的集 ...
2026-04-27实证分析是社会科学、自然科学、经济管理等领域开展研究的核心范式,其核心逻辑是通过对多维度数据的收集、分析与解读,揭示变量 ...
2026-04-27 很多数据分析师精通Excel函数和数据透视表,但当被问到“数据从哪里来”“表和视图有什么区别”“数据库管理系统和SQL是什么 ...
2026-04-27在大数据技术飞速迭代、数字营销竞争日趋激烈的今天,“精准触达、高效转化、成本可控”已成为企业营销的核心诉求。传统广告投放 ...
2026-04-24在游戏行业竞争白热化的当下,用户流失已成为制约游戏生命周期、影响营收增长的核心痛点。据行业报告显示,2024年移动游戏平均次 ...
2026-04-24 很多业务负责人开会常说“我们要数据驱动”,最后却变成“看哪张报表数据多就用哪个”,往往因为缺乏一套结构性的方法去搭建 ...
2026-04-24在Power BI数据可视化分析中,切片器是连接用户与数据的核心交互工具,其核心价值在于帮助使用者快速筛选目标数据、聚焦分析重点 ...
2026-04-23以数为据,以析促优——数据分析结果指导临床技术改进的实践路径 临床技术是医疗服务的核心载体,其水平直接决定患者诊疗效果、 ...
2026-04-23