京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在单因素方差分析ANOVA中,如果该因素影响比较显著,那么需要进一步利用多重比较方法比较该因素不同水平的影响,确定不同水平下该因素的影响是否显著。常见的多重比较方法主要有两种,LSD法和Tukey HSD法。下面对R语言中,这两种多重比较方法的实现进行举例。
前期数据如下,影响因素为group,指标为value:
> head(tarD)
value group sample time
A0522W11NC1 0.0002053745 normal A0522W11NC1 11week
A0522W11NC2 0.0031773712 normal A0522W11NC2 11week
A0522W11NC3 0.0060378288 normal A0522W11NC3 11week
A0522W11NC4 0.0017626931 normal A0522W11NC4 11week
A0522W11NC5 0.0018035261 normal A0522W11NC5 11week
A0522W11NC6 0.0036690067 normal A0522W11NC6 11week
> tmp <- aov(value ~ group, tarD)
最小显著差数检验法(LSD法)
> res <- LSD.test(tmp, 'group', p.adj = 'bonferroni')
> print(res$groups)
trt means M
1 normal 2.576910e-03 a
2 drug3 7.552555e-04 b
3 drug2 7.269247e-05 b
4 high_fat 6.220610e-05 b
5 drug1 2.954733e-05 b
Tukey氏固定差距检验法(Tukey HSD)
> TukeyHSD(tmp)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = value ~ group, data = tarD)
$group
diff lwr upr p adj
drug2-drug1 4.314514e-05 -0.0015468705 0.0016331608 0.9999916
drug3-drug1 7.257082e-04 -0.0008643074 0.0023157239 0.6929965
high_fat-drug1 3.265877e-05 -0.0015149488 0.0015802664 0.9999969
normal-drug1 2.547362e-03 0.0009997549 0.0040949700 0.0002613
drug3-drug2 6.825631e-04 -0.0009487586 0.0023138847 0.7563196
high_fat-drug2 -1.048637e-05 -0.0016005020 0.0015795293 1.0000000
normal-drug2 2.504217e-03 0.0009142017 0.0040942330 0.0004945
high_fat-drug3 -6.930494e-04 -0.0022830651 0.0008969662 0.7277757
normal-drug3 1.821654e-03 0.0002316386 0.0034116699 0.0175538
normal-high_fat 2.514704e-03 0.0009670961 0.0040623113 0.0003161
> TukeyHSD(tmp)$group
diff lwr upr p adj
drug2-drug1 4.314514e-05 -0.0015468705 0.0016331608 0.9999915820
drug3-drug1 7.257082e-04 -0.0008643074 0.0023157239 0.6929965170
high_fat-drug1 3.265877e-05 -0.0015149488 0.0015802664 0.9999969171
normal-drug1 2.547362e-03 0.0009997549 0.0040949700 0.0002612744
drug3-drug2 6.825631e-04 -0.0009487586 0.0023138847 0.7563195891
high_fat-drug2 -1.048637e-05 -0.0016005020 0.0015795293 0.9999999705
normal-drug2 2.504217e-03 0.0009142017 0.0040942330 0.0004944674
high_fat-drug3 -6.930494e-04 -0.0022830651 0.0008969662 0.7277757202
normal-drug3 1.821654e-03 0.0002316386 0.0034116699 0.0175537862
normal-high_fat 2.514704e-03 0.0009670961 0.0040623113 0.0003161003
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
在互联网产品运营、用户增长的实战场景中,很多从业者都会陷入一个误区:盲目投入资源做推广、拉新,却忽视了“拉新后的用户激活 ...
2026-02-06在机器学习建模过程中,特征选择是决定模型性能的关键环节——面对动辄几十、上百个特征的数据(如用户画像的几十项维度、企业经 ...
2026-02-06在CDA(Certified Data Analyst)数据分析师的日常实操中,表格结构数据是贯穿全流程的核心载体,而对表格数据类型的精准识别、 ...
2026-02-06在日常办公数据分析中,我们经常会面对杂乱无章的批量数据——比如员工月度绩效、产品销售数据、客户消费金额、月度运营指标等。 ...
2026-02-05在分类模型(如风控反欺诈、医疗疾病诊断、客户流失预警)的实操落地中,ROC曲线是评估模型区分能力的核心工具,而阈值则是连接 ...
2026-02-05对CDA(Certified Data Analyst)数据分析师而言,数据分析的价值不仅在于挖掘数据背后的规律与洞察,更在于通过专业的报告呈现 ...
2026-02-05在数据分析实战中,我们经常会遇到“多指标冗余”的问题——比如分析企业经营状况时,需同时关注营收、利润、负债率、周转率等十 ...
2026-02-04在数据分析场景中,基准比是衡量指标表现、评估业务成效、对比个体/群体差异的核心工具,广泛应用于绩效评估、业务监控、竞品对 ...
2026-02-04业务数据分析是企业日常运营的核心支撑,其核心价值在于将零散的业务数据转化为可落地的业务洞察,破解运营痛点、优化业务流程、 ...
2026-02-04在信贷业务中,违约率是衡量信贷资产质量、把控信用风险、制定风控策略的核心指标,其统计分布特征直接决定了风险定价的合理性、 ...
2026-02-03在数字化业务迭代中,AB测试已成为验证产品优化、策略调整、运营活动效果的核心工具。但多数业务场景中,单纯的“AB组差异对比” ...
2026-02-03企业战略决策的科学性,决定了其长远发展的格局与竞争力。战略分析方法作为一套系统化、专业化的思维工具,为企业研判行业趋势、 ...
2026-02-03在统计调查与数据分析中,抽样方法分为简单随机抽样与复杂抽样两大类。简单随机抽样因样本均匀、计算简便,是基础的抽样方式,但 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02在数据驱动企业发展的今天,“数据分析”已成为企业经营决策的核心支撑,但实践中,战略数据分析与业务数据分析两个概念常被混淆 ...
2026-02-02B+树作为数据库索引的核心数据结构,其高效的查询、插入、删除性能,离不开节点间指针的合理设计。在日常学习和数据库开发中,很 ...
2026-01-30在数据库开发中,UUID(通用唯一识别码)是生成唯一主键、唯一标识的常用方式,其标准格式包含4个短横线(如550e8400-e29b-41d4- ...
2026-01-30商业数据分析的价值落地,离不开标准化、系统化的总体流程作为支撑;而CDA(Certified Data Analyst)数据分析师,作为经过系统 ...
2026-01-30在数据分析、质量控制、科研实验等场景中,数据波动性(离散程度)的精准衡量是判断数据可靠性、稳定性的核心环节。标准差(Stan ...
2026-01-29在数据分析、质量检测、科研实验等领域,判断数据间是否存在本质差异是核心需求,而t检验、F检验是实现这一目标的经典统计方法。 ...
2026-01-29