京公网安备 11010802034615号
经营许可证编号:京B2-20210330
假设检验是统计学中的一种推断方法,用来判断两个样本或总体间的差异是由于抽样误差引起的还是本质差别造成的。R语言中提供了很多假设检验函数,如F检验,t检验和卡方检验等等。本篇文章介绍如何使用R语言中的这些函数进行假设检验。
二项分布检验
假设一个广告的点击率为0.02,更换新的广告创意后1000次曝光获得了23次点击,新广告在点击率上是否明显优于老广告?
H0:新广告与老广告效果无差异
H1:新广告效果优于老广告
#老广告点击率0.02,新广告1000次广告曝光获得23次点击是否明显优于老广告binom.test(x =23,n = 1000,p = 0.02,alternative ="greater",conf.level = 0.95 )
p-value = 0.2778>0.05,在0.95的置信区间下接受原假设H0。新广告与老广告在点击率上没有显著差异。
#1000次访问0.02点击率下差异显著的临界值qbinom(p = 0.95,size = 1000,prob = 0.02)
[1] 28
新广告在1000次广告曝光中点击量需要提升到28次以上才能明显优于老广告的效果。
假设一次市场推广活动中前一个小时有50人注册,后一个小时有60人注册,后一小时的注册人数是否明显高于前一小时?
H0:前一小时与后一小时注册人数无差异
H1:后一小时注册用户数量高于前一小时
#上一小时50人注册,下一小时60人注册,后一小时是否显著高于前一小时poisson.test(x = 60,T = 50,alternative ="greater",conf.level = 0.95)
p-value = 0.09227>0.05,在0.95的置信区间下接受原假设H0,后一小时注册人数与前一小时无差异。
#与上一小时50人注册差异显著的临界值
qpois(0.95,lambda=50)
[1] 62
后一小时的注册用户数需要提升到62以上才能明显高于前一小时的注册用户数。
假设某流量渠道的目标是每日带来150个咨询,在过去的一周带来的咨询用户数量分别为229,164,121,137,145,127,123,我们是否能认为该渠道已经达到目标,即每日的平均咨询量大于150?
这里使用单样本t检验,首先建立假设。
H0:每日平均咨询量不大于153,未达到目标。
H1:每日平均咨询量大于153,达到目标。
#将过去一周咨询用户数量赋给XX=c(229,164,121,137,155,127,143)#计算过去一周咨询量的均值mean(X)
[1] 153.7143
#过去一周咨询用户数量是否达到目标
t.test(X,alternative ="greater",mu=153,conf.level = 0.95)
p-value = 0.4801>0.05,在0.95的置信区间下接受原假设H0,流量渠道的咨询量没有达到目标。
假设两个流量渠道在过去的一周分布为网站带来咨询用户,这两个流量渠道带来的咨询用户数量是否有显著差异?
这里使用双样本t检验,首先建立假设。
H0:两个流量渠道带来的咨询用户数量没有显著差异。
H1:两个流量渠道带来的咨询用户数量存在有显著差异。
#流量渠道1带来的咨询用户数量赋值给
XX=c(229,164,121,137,155,127,143)
#流量渠道2带来的咨询用户数量赋值给
YY=c(175,120,187,144,117,184,135)
进行双样本t检验之前先进行方差检验,确定两组样本方差是否相同。 H0:两个总体方差相同 H1:两个总体方差不同
#方差检验,确定两个流量渠道的咨询量是否相同
var.test(x = X,y = Y,conf.level =0.95)
p-value = 0.6469>0.05,在0.95的置信区间下接受原假设H0,两个总体方差相同。进行等方差t检验。
#等方差t检验,两个流量渠道带来的咨询用户数量是否有差异
t.test(X,Y,var.equal=TRUE,alternative ="two.sided")
p-value = 0.9125>0.05,接受原假设H0,在0.95的置信区间下两个流量渠道的咨询用户量没有显著差异。
假设网站对咨询流程进行了优化并进行了测试,那么改版后的效果是否明显优于改版前?
这里使用成对t检验,首先建立假设。
H0:改版后的效果与改版前无差异
H1:改版后的效果明显优于改版前
#改版前注册用户量赋给before
before=c(229,164,121,137,155,127,143)
#改版后注册用户量赋给after
after=c(217,284,155,190,158,170,180)
#改版前的咨询量是否小于改版后的咨询量
t.test(before-after,alternative ="less",conf.level = 0.95)
p-value = 0.02362<0.05,拒绝原假设H0,接受备择假设H1。在0.95的置信区间下改版后的效果明显优于改版前。
假设广告创意A1315次访问,65次转化,转化率4.94%,广告创意B939次访问,54次转化,转化率5.75%。广告创意B的效果是否优于广告创意A?
这里使用卡方检验,首先建立假设。
H0:两个广告创意的效果无差异
H1:广告创意B的效果优于广告创意A
对源数据近整理,广告创意A1250次未购买,65次购买,广告创意B885次未购买,54次购买。以此建立列联表。
#创建列联表X=c(1250,885,65,54)
dim(X)=c(2,2)
X
#使用卡方检验chisq.test(X,correct =FALSE)
p-value = 0.3978>0.05,在0.95的置信区间下接受原假设H0,两个广告创意效果没有显著差异。
数据分析咨询请扫描二维码
若不方便扫码,搜微信号:CDAshujufenxi
数据分析的核心价值在于用数据驱动决策,而指标作为数据的“载体”,其选取的合理性直接决定分析结果的有效性。选对指标能精准定 ...
2026-01-23在MySQL查询编写中,我们习惯按“SELECT → FROM → WHERE → ORDER BY”的语法顺序组织语句,直觉上认为代码顺序即执行顺序。但 ...
2026-01-23数字化转型已从企业“可选项”升级为“必答题”,其核心本质是通过数据驱动业务重构、流程优化与模式创新,实现从传统运营向智能 ...
2026-01-23CDA持证人已遍布在世界范围各行各业,包括世界500强企业、顶尖科技独角兽、大型金融机构、国企事业单位、国家行政机关等等,“CDA数据分析师”人才队伍遵守着CDA职业道德准则,发挥着专业技能,已成为支撑科技发展的核心力量。 ...
2026-01-22在数字化时代,企业积累的海量数据如同散落的珍珠,而数据模型就是串联这些珍珠的线——它并非简单的数据集合,而是对现实业务场 ...
2026-01-22在数字化运营场景中,用户每一次点击、浏览、交互都构成了行为轨迹,这些轨迹交织成海量的用户行为路径。但并非所有路径都具备业 ...
2026-01-22在数字化时代,企业数据资产的价值持续攀升,数据安全已从“合规底线”升级为“生存红线”。企业数据安全管理方法论以“战略引领 ...
2026-01-22在SQL数据分析与业务查询中,日期数据是高频处理对象——订单创建时间、用户注册日期、数据统计周期等场景,都需对日期进行格式 ...
2026-01-21在实际业务数据分析中,单一数据表往往无法满足需求——用户信息存储在用户表、消费记录在订单表、商品详情在商品表,想要挖掘“ ...
2026-01-21在数字化转型浪潮中,企业数据已从“辅助资源”升级为“核心资产”,而高效的数据管理则是释放数据价值的前提。企业数据管理方法 ...
2026-01-21在数字化商业环境中,数据已成为企业优化运营、抢占市场、规避风险的核心资产。但商业数据分析绝非“堆砌数据、生成报表”的简单 ...
2026-01-20定量报告的核心价值是传递数据洞察,但密密麻麻的表格、复杂的计算公式、晦涩的数值罗列,往往让读者望而却步,导致核心信息被淹 ...
2026-01-20在CDA(Certified Data Analyst)数据分析师的工作场景中,“精准分类与回归预测”是高频核心需求——比如预测用户是否流失、判 ...
2026-01-20在建筑工程造价工作中,清单汇总分类是核心环节之一,尤其是针对楼梯、楼梯间这类包含多个分项工程(如混凝土浇筑、钢筋制作、扶 ...
2026-01-19数据清洗是数据分析的“前置必修课”,其核心目标是剔除无效信息、修正错误数据,让原始数据具备准确性、一致性与可用性。在实际 ...
2026-01-19在CDA(Certified Data Analyst)数据分析师的日常工作中,常面临“无标签高维数据难以归类、群体规律模糊”的痛点——比如海量 ...
2026-01-19在数据仓库与数据分析体系中,维度表与事实表是构建结构化数据模型的核心组件,二者如同“骨架”与“血肉”,协同支撑起各类业务 ...
2026-01-16在游戏行业“存量竞争”的当下,玩家留存率直接决定游戏的生命周期与商业价值。一款游戏即便拥有出色的画面与玩法,若无法精准识 ...
2026-01-16为配合CDA考试中心的 2025 版 CDA Level III 认证新大纲落地,CDA 网校正式推出新大纲更新后的第一套官方模拟题。该模拟题严格遵 ...
2026-01-16在数据驱动决策的时代,数据分析已成为企业运营、产品优化、业务增长的核心工具。但实际工作中,很多数据分析项目看似流程完整, ...
2026-01-15