京公网安备 11010802034615号
经营许可证编号:京B2-20210330
在单因素方差分析ANOVA中,如果该因素影响比较显著,那么需要进一步利用多重比较方法比较该因素不同水平的影响,确定不同水平下该因素的影响是否显著。常见的多重比较方法主要有两种,LSD法和Tukey HSD法。下面对R语言中,这两种多重比较方法的实现进行举例。
前期数据如下,影响因素为group,指标为value:
> head(tarD)
value group sample time
A0522W11NC1 0.0002053745 normal A0522W11NC1 11week
A0522W11NC2 0.0031773712 normal A0522W11NC2 11week
A0522W11NC3 0.0060378288 normal A0522W11NC3 11week
A0522W11NC4 0.0017626931 normal A0522W11NC4 11week
A0522W11NC5 0.0018035261 normal A0522W11NC5 11week
A0522W11NC6 0.0036690067 normal A0522W11NC6 11week
> tmp <- aov(value ~ group, tarD)
最小显著差数检验法(LSD法)
> res <- LSD.test(tmp, 'group', p.adj = 'bonferroni')
> print(res$groups)
trt means M
1 normal 2.576910e-03 a
2 drug3 7.552555e-04 b
3 drug2 7.269247e-05 b
4 high_fat 6.220610e-05 b
5 drug1 2.954733e-05 b
Tukey氏固定差距检验法(Tukey HSD)
> TukeyHSD(tmp)
Tukey multiple comparisons of means
95% family-wise confidence level
Fit: aov(formula = value ~ group, data = tarD)
$group
diff lwr upr p adj
drug2-drug1 4.314514e-05 -0.0015468705 0.0016331608 0.9999916
drug3-drug1 7.257082e-04 -0.0008643074 0.0023157239 0.6929965
high_fat-drug1 3.265877e-05 -0.0015149488 0.0015802664 0.9999969
normal-drug1 2.547362e-03 0.0009997549 0.0040949700 0.0002613
drug3-drug2 6.825631e-04 -0.0009487586 0.0023138847 0.7563196
high_fat-drug2 -1.048637e-05 -0.0016005020 0.0015795293 1.0000000
normal-drug2 2.504217e-03 0.0009142017 0.0040942330 0.0004945
high_fat-drug3 -6.930494e-04 -0.0022830651 0.0008969662 0.7277757
normal-drug3 1.821654e-03 0.0002316386 0.0034116699 0.0175538
normal-high_fat 2.514704e-03 0.0009670961 0.0040623113 0.0003161
> TukeyHSD(tmp)$group
diff lwr upr p adj
drug2-drug1 4.314514e-05 -0.0015468705 0.0016331608 0.9999915820
drug3-drug1 7.257082e-04 -0.0008643074 0.0023157239 0.6929965170
high_fat-drug1 3.265877e-05 -0.0015149488 0.0015802664 0.9999969171
normal-drug1 2.547362e-03 0.0009997549 0.0040949700 0.0002612744
drug3-drug2 6.825631e-04 -0.0009487586 0.0023138847 0.7563195891
high_fat-drug2 -1.048637e-05 -0.0016005020 0.0015795293 0.9999999705
normal-drug2 2.504217e-03 0.0009142017 0.0040942330 0.0004944674
high_fat-drug3 -6.930494e-04 -0.0022830651 0.0008969662 0.7277757202
normal-drug3 1.821654e-03 0.0002316386 0.0034116699 0.0175537862
normal-high_fat 2.514704e-03 0.0009670961 0.0040623113 0.0003161003
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
【核心关键词】主数据、资产、供应商、现金流、企业、精细化、集团、数字化、中国、数据质量、数据管理、经营管理、地产行业、 ...
2026-06-24在数据分析、假设检验、AB测试、学术研究等统计场景中,显著水平(α)与P值(P-value)是判断统计结果是否具有统计学意义的两个 ...
2026-06-24小李刚入职了一家互联网公司的运营部门。第一次参加业务复盘会,运营主管问了一个看似简单的问题:“这个月新用户留存率下降了5 ...
2026-06-24在数字化转型全面渗透的产业背景下,数据分析已成为互联网、金融、零售、制造等几乎所有行业的核心岗位能力。很多初学者对数据分 ...
2026-06-23在企业并购、股权定价、投融资评估、资产核算等资本市场核心场景中,市场法是应用最广泛、市场认可度最高的企业价值评估方法。传 ...
2026-06-23 许多数据分析师精通Excel函数和SQL查询,但当面对一张上万行的销售明细表,要快速回答“哪个地区销量最高”“哪款产品增长最 ...
2026-06-23【核心关键词】运营、证书、金融、客户、产品、软件、销售额、量化、科技、数据分析、金融行业、证券类软件、业务流程、金融机 ...
2026-06-22在企业方案选型、产品迭代评审、供应商筛选、运营效果复盘等决策场景中,单一指标的优劣判断往往无法支撑科学决策。一套转化效果 ...
2026-06-22 很多数据分析师掌握了Excel函数、会写SQL查询,但当被问到“数据从哪里来”“数据加工有哪些步骤”“如何使用分析工具连接数 ...
2026-06-22【核心关键词】软件、洞察力、大数据、产品、经验、硬件、流量、创新、决策、数据安全、网络安全、数据分析、决策制定、数据挖 ...
2026-06-18在方案选型、效果复盘、产品评估、供应商筛选等各类业务决策场景中,仅凭单一指标下结论往往会陷入 “以偏概全” 的误区。多维度 ...
2026-06-18 很多数据分析师精通Excel单元格操作,但当被问到“表结构数据的基本处理单位是什么”“字段和记录的本质区别”“为什么表结 ...
2026-06-18在数据分析、用户运营与业务增长的工作体系中,漏斗拆解是最基础也最高频的问题定位方法。很多业务场景下,我们只能看到最终的转 ...
2026-06-17在数据库开发、数据清洗与报表统计场景中,数值类型转换为日期是高频刚需操作。业务系统常以 Unix 时间戳、整型日期(如20240617 ...
2026-06-17 数据分析师八成以上的时间在和数据表格打交道,但许多人拿到Excel后习惯性地先算、先分析,结果回头发现漏了一列关键数据, ...
2026-06-17【核心关键词】数据库、电商、知识、产品、数据产品、监管业务、产品经理、业务系统、用户行为分析、用户分析、数据分析、电商 ...
2026-06-16在 Python 动态类型与面向对象的编程体系中,变量定义与类实例化是构建代码逻辑的两大核心基石。变量是数据存储、传递与运算的基 ...
2026-06-16 很多数据分析师每天与Excel打交道,但当被问到“表格结构数据和表结构数据有什么区别”“数据类型误判会引发哪些分析错误” ...
2026-06-16在 MySQL 查询性能优化体系中,索引是降低查询耗时、提升数据库吞吐的核心手段。其中联合索引与覆盖索引是实际开发中最高频的两 ...
2026-06-15在数据仓库建设与商业智能分析体系中,维度建模是应用最广泛的建模方法论,而事实表与维度表是维度建模的两大核心构件,共同构成 ...
2026-06-15