京公网安备 11010802034615号
经营许可证编号:京B2-20210330
SPSS分析技术:频数分布;数据的心灵窗户
频数是指某一观察值出现的次数,把观察值及其相应的频数全部罗列出来就是频数分布。例如,可以将我们国家的全部人口按照年龄做出频数分布。频数分布能够帮助我们了解某个事件的各种可能发生结果的发生次数和概率,除此之外,通过频数分布表可以对数据进行分组归类整理,展示数据的集中趋势和离散程度,因此是非常重要的描述性统计分析方法。
频数分布表除了有频数数据以外,还可以计算概率等其它数据,其主要组成成分有 :
频数:指示变量值在某个区间(或类别)内的次数;
百分比:指示各频数占总样本频数的百分比;
有效百分比:指示各频数占总有效样本的百分比;
累计百分比:指示百分比逐级累加的结果,最终取值为100%;
常用频数统计图
统计图是一种最为直观的数据指示方法,能清晰展示变量的取值分布状况。常用的频数统计图有条形图、饼图和直方图等。通过SPSS软件生成条形图、饼图和直方图等统计图,便于直观地展现频数的分布形态。
SPSS的频数分析
社会调查是研究社会现象的重要手段。现在有一份社会调查问卷,需要采集受访者的年龄、工作、教育程度、家庭成员情况、学历、家庭总收入等变量。共采集了2832份有效问卷。我们利用这份庞大的数据分析个人收入数据的情况。在这里可以采用频数分析对个人收入的集中程度和离散程度进行描述。
分析步骤
1、选择菜单【分析】-【描述统计】-【频率】,将个人收入选入变量框中;同时选中左下角的显示频率表;
2、打开【频率:统计】,选择需要输出的统计量。该对话框包含四个统计量选项组,分别为百分位值、集中趋势、离散和分布。本例选择四分位数、平均值、中位数、偏度、峰度、标准差、方差、范围、最小值、最大值和标准误差平均值等统计量。如下图所示:
3、单击图表按钮,本例选择直方图,并选中在直方图上显著正态曲线;图标值选项选择默认设置频率。
4、其它选择保持系统默认状态。点击确定,输出结果。
结果解释
1、描述性统计结果;
2、频数分布表;
由上表可知:此次社会调查的受访者共计2832人,有效回答者1849人,占到65.3%,由于种种原因导致无效个案为983人,占34.7%。从收入看,受访者高收入人数占大多数;再看受访者收入的方差较大,说明受访者个人收入差距较大。
3、带正态曲线的直方图;
从直方图可以看出,受访者的收入分布呈严重负偏态,数据多集中于高数值部分。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15 很多数据分析师能熟练计算指标,但当被问到“这家企业的核心业务目标是什么”“如何把模糊的战略目标拆解为可量化的指标”“ ...
2026-06-15在数据分析、业务监控、运营复盘等场景中,列值趋势计算是核心需求之一。无论是分析销售额的月度增长、用户活跃的变化趋势、库存 ...
2026-06-12在数字经济深度渗透的当下,消费者的购买行为已从过去的 “被动接受” 转变为 “主动决策”。流量红利消退、获客成本攀升、用户 ...
2026-06-12CDA三级认证是三个级别中的塔尖,全面考察数据战略、团队领导和复杂项目的综合能力。它所对应的《敏捷数据挖掘》教材,不再局限 ...
2026-06-12在游戏产业的商业逻辑中,付费玩家是支撑游戏生存与发展的核心支柱。行业普遍遵循 “二八定律”:20% 的付费玩家贡献了游戏 80% ...
2026-06-11【核心关键词】企业、定位、传统、产品、互联网、可视化、业务侧、数字化、结构化、数据分析、传统制造业、市场状态、发展空间 ...
2026-06-11 解读《CDA二级教材:量化策略分析(2025)》的全景结构与学习逻辑 ” CDA二级认证是企业招聘数据分析师时最常提及的证书门槛 ...
2026-06-11【核心关键词】药企、可视化、营销、分类、数据分析师、销售数据、业务人员、指导方向、分析报告、营销数据、营销医生 【专访摘 ...
2026-06-10在统计学分析、问卷调研、实验验证、业务复盘等场景中,卡方检验与 T 检验是应用最广泛的两类基础假设检验方法。前者专门处理分 ...
2026-06-10