京公网安备 11010802034615号
经营许可证编号:京B2-20210330
用spss判断正态性检验的几种方法
题目: 某地 120 名男性红细胞数(blood)的数据(见程序中“BEGIN DATA”与“END DATA”之间的数据),此数据呈正态分布吗?(引自马斌荣主编书著,2001. P.150)
syntax 窗口编码如下:
* Ma Bin-Rong: SPSS for Medical Application,2Edit. 2001, P.150:.
DATA LIST FREE /blood.
BEGIN DATA.
568 460 500 580 560 434 561 570 519 645 563 552
540 541 461 501 581 620 573 518 562 597 551 574
480 481 542 462 502 584 517 637 580 547 521 442
564 575 482 543 463 503 585 572 541 525 495 523
634 532 565 483 544 464 504 559 587 494 522 448
526 618 595 577 484 545 558 505 493 586 622 524
456 576 527 490 579 557 546 466 506 572 533 450
566 528 491 567 556 465 485 547 588 507 589 535
596 492 569 555 578 513 530 486 548 534 508 588
628 526 554 531 512 570 514 521 487 459 590 509
END DATA.
NPAR TESTS /K-S(NORMAL)= blood /STATISTICS=DESCRIPTIVES.
DESCRIPTIVES VARIABLES=blood /STATISTICS=ALL.
FREQUENCIES VARIABLES=blood
/STATISTICS=ALL
/HISTOGRAM=NORMAL.
PPLOT /VARIABLES=blood /TYPE=Q-Q.
注: " *````` . " 在syntax中,表示注释的意思.
FREQUENCIES 语句用来描述频次;NPAR TESTS /K-S 语句是k-s检验,检验数据是否符合特定的分布。其中ORAML 表示检验的正态分布。 另:均匀分布是 UNIFORM ;泊松分布是 POISSON ; 指数分布是 EXPONENTIAL ; PPLOT语句生成pp图,检验正态分布与否。
代码执行后,结果如下:
结果分析:
Kolmogorov-Smirnov Test 的结果中, z 值等于0.532,p值等于0.940>0.5,因此数据呈近似正态分布。
Descriptive statics结果中,偏度系数Skewness=-0..33;峰度系数Kurtosis=-0.517;两个系数都小于1,可认为近似于正态分布。
QQ Plot 中,各点近似围绕着直线,说明数据呈近似正态分布。
结果思考:
检验数据的正态性,方法有很多,k-s test,descriptive,qq plot 等方法都可以检验数据的正态性。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03在数字化业务迭代中,AB测试已成为验证产品优化、策略调整、运营活动效果的核心工具。但多数业务场景中,单纯的“AB组差异对比” ...
2026-02-03企业战略决策的科学性,决定了其长远发展的格局与竞争力。战略分析方法作为一套系统化、专业化的思维工具,为企业研判行业趋势、 ...
2026-02-03在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29统计制图(数据可视化)是数据分析的核心呈现载体,它将抽象的数据转化为直观的图表、图形,让数据规律、业务差异与潜在问题一目 ...
2026-01-29箱线图(Box Plot)作为数据分布可视化的核心工具,能清晰呈现数据的中位数、四分位数、异常值等关键统计特征,广泛应用于数据分 ...
2026-01-28在回归分析、机器学习建模等数据分析场景中,多重共线性是高频数据问题——当多个自变量间存在较强的线性关联时,会导致模型系数 ...
2026-01-28数据分析的价值落地,离不开科学方法的支撑。六种核心分析方法——描述性分析、诊断性分析、预测性分析、规范性分析、对比分析、 ...
2026-01-28在机器学习与数据分析领域,特征是连接数据与模型的核心载体,而特征重要性分析则是挖掘数据价值、优化模型性能、赋能业务决策的 ...
2026-01-27关联分析是数据挖掘领域中挖掘数据间潜在关联关系的经典方法,广泛应用于零售购物篮分析、电商推荐、用户行为路径挖掘等场景。而 ...
2026-01-27数据分析的基础范式,是支撑数据工作从“零散操作”走向“标准化落地”的核心方法论框架,它定义了数据分析的核心逻辑、流程与目 ...
2026-01-27在数据分析、后端开发、业务运维等工作中,SQL语句是操作数据库的核心工具。面对复杂的表结构、多表关联逻辑及灵活的查询需求, ...
2026-01-26支持向量机(SVM)作为机器学习中经典的分类算法,凭借其在小样本、高维数据场景下的优异泛化能力,被广泛应用于图像识别、文本 ...
2026-01-26