
SPSS详细操作:正态转换的多种方法
一、正偏态分布资料
1、轻度正偏态分布
偏度值>0,偏度值为其标准误差的2-3倍,即Z-score=2~3,此时认为资料分布呈现轻度的正偏态分布,可以考虑对变量x取根号开平方的方法来进行转换。
SPSS语句如下:
COMPUTE x_new = SQRT(x)
(SQRT为开平方根Square Root缩写)
2、中度正偏态分布
偏度值>0,偏度值为其标准误差的3倍以上,即Z-score>3,此时认为资料分布呈现中度的正偏态分布,可以考虑对变量x取对数来进行转换。可以取自然对数(ln)或以10为底的对数(log10)。
SPSS语句如下:
COMPUTE x_new = LN(x)
COMPUTE x_new = LG10(x)
注意:LG10的纠正力度较强,有时甚至会矫枉过正,将正偏态转换为负偏态,因此在进行正态转换后一定要对该变量再次进行正态性检验。
3、重度正偏态分布
对于两端波动比较大的数据资料,极端值可能产生较大的影响,此时可以考虑取倒数的方法来进行转换。
SPSS语句如下:
COMPUTE x_new = 1/x
注意:根号下要求数据均为非负数(即≥0),对数要求数据均为正数(即>0),取倒数要求分母不为0, 如果变量x中出现上述情况,则需要先将其进行一定的转换,如x+K或K-x,再对其取根号、对数或倒数。其中K为一个常数,可以根据需要进行赋值,例如赋值为1,或取数据的最小值、最大值等。
二、负偏态分布资料
对于负偏态分布的数据资料,首先需要将负偏态资料进行反转,转换为正偏态,然后再参考正偏态分布资料的转换方法进行转换。
反转的方法:首先找出该数据系列的最大值max,用最大值+1,再减去每个数值
1、轻度负偏态分布
SPSS语句如下:
COMPUTE x_new = SQRT(max+1-x)
2、中度负偏态分布
SPSS语句如下:
COMPUTE x_new = LN(max+1-x)
COMPUTE x_new = LG10(max+1-x)
3、重度负偏态分布
SPSS语句如下:
COMPUTE x_new = 1/(max+1-x)
三、SPSS操作:函数转换法
以分析某人群甘油三酯(TG)的分布特征为例。
1、对TG分布进行正态性检验
采用上期介绍的Explore方法:Analyze→Descriptive Statistics→Explore
结果显示:偏度值为1.314>0,峰度值为1.596>0,偏度Z-score=1.314/0.172 = 7.640>3,Kolmogorov–Smirnov和Shapiro-Wilk检验P值均<0.001,从直方图也可以直观的看出TG在该人群中的分布呈现中度正偏态分布特征。
2、对TG进行正态转换
根据以上正态性检验结果,拟采用取对数的方法进行正态转换,以Log10为例。
(1) 选择Transform → Compute Variable
(2) 在Target Variable框中输入一个新的变量名,作为数据转换后的变量名,此处设定为TG_new
(3) 在Function group中选择Arithmetic,在Functions and Special Variables中双击Lg10,此时在Numeric Expression框中显示LG10(?)
(4) 从变量列表中双击TG,此时在Numeric Expression框中显示LG10(TG)
(5) 点击OK完成操作
3、对转换后的TG_new再次进行正态性检验
(1) 在结果输出的Descriptives表格中显示,偏度值为0.204≈0,峰度值为-0.338≈0,偏度Z-score=0.204/0.172=1.186<1.96,提示服从正态分布。
(2) 在结果输出的Tests of Normality表格中显示,Kolmogorov-Smirnov和Shapiro-Wilk检验P值分别为0.200和0.272,均>0.05,提示服从正态分布。
(3) 从直方图和Q-Q图也可以直观的看出,转换后的TG_new服从正态分布。
四、SPSS操作:正态得分法
对于初学者在初学时无法很好掌握数据资料分布特征的情况下,SPSS提供了一种通过计算正态得分的方法来实现正态转换。
1、操作过程
选择Transform→Rank Cases,将TG选入Variable(s)框中
点击Rank Type选项框,取消默认勾选的Rank,勾选Normal scores选项
在Proportion Estimation Formula下有4种方法可供选择,默认Blom方法,其他方法也可以进行尝试。点击OK完成操作。
2、结果解读
程序运行后在变量列表中多出了一个名为NTG的新变量,即为计算的正态得分,采用Explore方法对NTG进行正态性检验以验证转化效果。
(1) 在结果输出的Descriptives表格中显示,偏度值为0.001≈0,峰度值为-0.124≈0,偏度Z-score=0.001/0.172=0.006<1.96,提示服从正态分布。
(2) 在结果输出的Tests of Normality表格中显示,Kolmogorov-Smirnov和Shapiro-Wilk检验P值分别为0.200和1.000,均>0.05,提示服从正态分布。
(3) 从直方图和Q-Q图也可以直观的看出,转换后的NTG服从正态分布。
五、注意事项
1、不是任何非正态数据都可以进行正态转换,若有把握认为数据的总体分布是正态的时候才可以去做正态转换。如果通过变量转换的方法依然无法将数据转化为正态分布的话,就不再适用于T检验、方差分析等方法了,此时可以应用前期介绍过的非参数检验的方法来进行分析,例如Wilcoxon检验和Mann-Whitney U检验方法等。
2、在进行T检验、方差分析等方法时,要求每组数据均呈正态分布,因此当出现某一组数据正态,另一组数据非正态时,需要对两组数据同时进行转换。
3、在进行相关分析或线性回归时,要求变量间存在线性关系,如果因变量与某个自变量之间呈现出曲线趋势,此时转换的变量可以是自变量,也可以是因变量,或者两者均可。如果进行了变量变换,则应当重新绘制散点图,以保证线性趋势在变换后仍然存在。
4、在对线性回归模型进行解释时,如果使用函数转换的方法对变量进行了转换,则解释时应按照转换后的变量给予解释,或者可以根据转换时使用的函数关系,倒推原始自变量对原始因变量的效应大小。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
用 Power BI 制作地图热力图:基于经纬度数据的实践指南 在数据可视化领域,地图热力图凭借直观呈现地理数据分布密度的优势,成 ...
2025-07-24解析 insert into select 是否会锁表:原理、场景与应对策略 在数据库操作中,insert into select 是一种常用的批量数据插入语句 ...
2025-07-24CDA 数据分析师的工作范围解析 在数字化时代的浪潮下,数据已成为企业发展的核心资产之一。CDA(Certified Data Analyst)数据分 ...
2025-07-24从 CDA LEVEL II 考试题型看 Python 数据分析要点 在数据科学领域蓬勃发展的当下,CDA(Certified Data Analyst)认证成为众多从 ...
2025-07-23用 Python 开启数据分析之旅:从基础到实践的完整指南 在数据驱动决策的时代,数据分析已成为各行业不可或缺的核心能力。而 Pyt ...
2025-07-23鸢尾花判别分析:机器学习中的经典实践案例 在机器学习的世界里,有一个经典的数据集如同引路明灯,为无数初学者打开了模式识别 ...
2025-07-23解析 response.text 与 response.content 的核心区别 在网络数据请求与处理的场景中,开发者经常需要从服务器返回的响应中提取数 ...
2025-07-22解析神经网络中 Softmax 函数的核心作用 在神经网络的发展历程中,激活函数扮演着至关重要的角色,它们为网络赋予了非线性能力, ...
2025-07-22CDA数据分析师证书考取全攻略 一、了解 CDA 数据分析师认证 CDA 数据分析师认证是一套科学化、专业化、国际化的人才考核标准, ...
2025-07-22左偏态分布转正态分布:方法、原理与实践 左偏态分布转正态分布:方法、原理与实践 在统计分析、数据建模和科学研究中,正态分 ...
2025-07-22你是不是也经常刷到别人涨粉百万、带货千万,心里痒痒的,想着“我也试试”,结果三个月过去,粉丝不到1000,播放量惨不忍睹? ...
2025-07-21我是陈辉,一个创业十多年的企业主,前半段人生和“文字”紧紧绑在一起。从广告公司文案到品牌策划,再到自己开策划机构,我靠 ...
2025-07-21CDA 数据分析师的职业生涯规划:从入门到卓越的成长之路 在数字经济蓬勃发展的当下,数据已成为企业核心竞争力的重要来源,而 CD ...
2025-07-21MySQL执行计划中rows的计算逻辑:从原理到实践 MySQL 执行计划中 rows 的计算逻辑:从原理到实践 在 MySQL 数据库的查询优化中 ...
2025-07-21在AI渗透率超85%的2025年,企业生存之战就是数据之战,CDA认证已成为决定企业存续的生死线!据麦肯锡全球研究院数据显示,AI驱 ...
2025-07-2035岁焦虑像一把高悬的利刃,裁员潮、晋升无望、技能过时……当职场中年危机与数字化浪潮正面交锋,你是否发现: 简历投了10 ...
2025-07-20CDA 数据分析师报考条件详解与准备指南 在数据驱动决策的时代浪潮下,CDA 数据分析师认证愈发受到瞩目,成为众多有志投身数 ...
2025-07-18刚入职场或是在职场正面临岗位替代、技能更新、人机协作等焦虑的打工人,想要找到一条破解职场焦虑和升职瓶颈的系统化学习提升 ...
2025-07-182025被称为“AI元年”,而AI,与数据密不可分。网易公司创始人丁磊在《AI思维:从数据中创造价值的炼金术 ...
2025-07-18CDA 数据分析师:数据时代的价值挖掘者 在大数据席卷全球的今天,数据已成为企业核心竞争力的重要组成部分。从海量数据中提取有 ...
2025-07-18