京公网安备 11010802034615号
经营许可证编号:京B2-20210330
用SPSS做数据分析?先弄懂SPSS的基础知识吧
1、SPSS数据分析的流程

2、SPSS特性:

3、数据的编辑
常量
变量
变量的测试方式
操作符与表达式
常用的数据操作命令
Data->Sort Cases
Transform->Rank Cases
Transform->Count
Transform->Recode
Transform->Automatic Recode
Transform->Compute
Data->Transpose
Data->Split Files
Data->Merge Files
Compute
Rocode
Split file
analyze all case分析所有的样本,不产生分组;
compare groups产生对比分析组;
output by groups分组输入分析结果;
Merge File
数据的分类汇总
检查重复的数据
数据的加权
选取一定的case进行分析
常用的数学函
取绝对值:abs(数字型表达式)
求余数函数:mod(数字型表达式,模数),模数不能为0该函数在需要对某一变量求模数的余数时使用,如果对一个顺序编号或自然数序列求模数的余数,可将该序列按模数等距分类,从而实行等距抽样;
四舍五入函数:rnd(数字型表达式)
开方函数:sqrt(数字型表达式)
4、基本的统计分析
SPSS统计分析概述:
Descriptive Statistics
– Frequencies:频数分析
– Descriptives:描述统计
– Explore:探索分析
– Crosstabs:列联表分析
– Ratio:比率分析
Descriptives
– 可以对变量进行标准化;
Explore
– Explore是对连续性变量进行探索性分析最有效的工具;
– 考察数据的奇异性和分布特征;
– 箱盒图、茎叶图、正态检验图及方差齐次性检验;
Crosstabs
– 数据类型要求为分类变量;
– 二维或多维交叉频数表(列联表),分析事物(变量)之间的相互影响和关系;
– 可以做卡方检验,来分析行列变量之间是否存在相关性;
分类变量统计描述常用指标
– 统计量:
• 频数、频率、累计频数、累计频率、众数
• 比:任意两个变量之比
性别比,货物/销售人员比
构成比:部分占总体的比例
• 率:事件的发生强度
– 图形:
• 条图、饼图
Spss操作
– 单个变量的分析
• Analyze…Descriptive Statistics…Frequcencies
– 多个变量的分析
• Analyze…Descriptive Statistics…Crosstabs
– 条图
• Graph…(interactive…)bar
– 饼图
• Graph…(interactive…)pie
连续变量的描述指标
– 频数表Frequency
• 直观的方法:分布类型分布特征
– 集中趋势Central tendency
• 均数mean 中位数median 众数mode
– 离散趋势Dispersion tendency
• 全距Range
• 方差Variance 标准差std.deviation
如何计算各个描述统计量
– Analyze->Descriptive Statistics->Frequcencies…
– Analyze->Descriptive Statistics->Descriptives…
– Analyze->compare means->means…
• 如何用图形描述连续变量
– Graph…Interactive…Histogram
• 如何应用Explore对连续变量进行探索性分析
– Analyze->Descriptive Statistics->Explore…
Basic Tables过程:对分类/定量资料进行各种复杂格式的描述;
• General Tables过程:在同一张表格内同时对分类资料、连续资料和多选题数据进行汇总功能非常强大,但使用上相对复杂;
• Custom Tables过程:含有表格预览窗口,并可在制表过程中控制结果;
• Multiple Response Sets/Tables过程:专门为多选题数据设计的制表过程;
• Tables of Frequencies过程:在同一张表格中对多个分类变量同时输出频数表;
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在使用Excel透视表进行数据汇总分析时,我们常遇到“需通过两个字段相乘得到关键指标”的场景——比如“单价×数量=金额”“销量 ...
2025-11-14在测试环境搭建、数据验证等场景中,经常需要将UAT(用户验收测试)环境的表数据同步到SIT(系统集成测试)环境,且两者表结构完 ...
2025-11-14在数据驱动的企业中,常有这样的困境:分析师提交的“万字数据报告”被束之高阁,而一张简洁的“复购率趋势图+核心策略标注”却 ...
2025-11-14在实证研究中,层次回归分析是探究“不同变量组对因变量的增量解释力”的核心方法——通过分步骤引入自变量(如先引入人口统计学 ...
2025-11-13在实时数据分析、实时业务监控等场景中,“数据新鲜度”直接决定业务价值——当电商平台需要实时统计秒杀订单量、金融系统需要实 ...
2025-11-13在数据量爆炸式增长的今天,企业对数据分析的需求已从“有没有”升级为“好不好”——不少团队陷入“数据堆砌却无洞察”“分析结 ...
2025-11-13在主成分分析(PCA)、因子分析等降维方法中,“成分得分系数矩阵” 与 “载荷矩阵” 是两个高频出现但极易混淆的核心矩阵 —— ...
2025-11-12大数据早已不是单纯的技术概念,而是渗透各行业的核心生产力。但同样是拥抱大数据,零售企业的推荐系统、制造企业的设备维护、金 ...
2025-11-12在数据驱动的时代,“数据分析” 已成为企业决策的核心支撑,但很多人对其认知仍停留在 “用 Excel 做报表”“写 SQL 查数据” ...
2025-11-12金融统计不是单纯的 “数据计算”,而是贯穿金融业务全流程的 “风险量化工具”—— 从信贷审批中的客户风险评估,到投资组合的 ...
2025-11-11这个问题很有实战价值,mtcars 数据集是多元线性回归的经典案例,通过它能清晰展现 “多变量影响分析” 的核心逻辑。核心结论是 ...
2025-11-11在数据驱动成为企业核心竞争力的今天,“不知道要什么数据”“分析结果用不上” 是企业的普遍困境 —— 业务部门说 “要提升销量 ...
2025-11-11在大模型(如 Transformer、CNN、多层感知机)的结构设计中,“每层神经元个数” 是决定模型性能与效率的关键参数 —— 个数过少 ...
2025-11-10形成购买决策的四个核心推动力的是:内在需求驱动、产品价值感知、社会环境影响、场景便捷性—— 它们从 “为什么买”“值得买吗 ...
2025-11-10在数字经济时代,“数字化转型” 已从企业的 “可选动作” 变为 “生存必需”。然而,多数企业的转型仍停留在 “上线系统、收集 ...
2025-11-10在数据分析与建模中,“显性特征”(如用户年龄、订单金额、商品类别)是直接可获取的基础数据,但真正驱动业务突破的往往是 “ ...
2025-11-07在大模型(LLM)商业化落地过程中,“结果稳定性” 是比 “单次输出质量” 更关键的指标 —— 对客服对话而言,相同问题需给出一 ...
2025-11-07在数据驱动与合规监管双重压力下,企业数据安全已从 “技术防护” 升级为 “战略刚需”—— 既要应对《个人信息保护法》《数据安 ...
2025-11-07在机器学习领域,“分类模型” 是解决 “类别预测” 问题的核心工具 —— 从 “垃圾邮件识别(是 / 否)” 到 “疾病诊断(良性 ...
2025-11-06在数据分析中,面对 “性别与购物偏好”“年龄段与消费频次”“职业与 APP 使用习惯” 这类成对的分类变量,我们常常需要回答: ...
2025-11-06