使用R进行统计分析—假设检验-CDA数据分析师官网

热线电话：13121318867

首页精彩阅读使用R进行统计分析—假设检验

使用R进行统计分析—假设检验

2016-10-01

使用R进行统计分析—假设检验

假设检验是统计学中的一种推断方法，用来判断两个样本或总体间的差异是由于抽样误差引起的还是本质差别造成的。R语言中提供了很多假设检验函数，如F检验，t检验和卡方检验等等。本篇文章介绍如何使用R语言中的这些函数进行假设检验。

二项分布检验

假设一个广告的点击率为0.02，更换新的广告创意后1000次曝光获得了23次点击，新广告在点击率上是否明显优于老广告？

H0：新广告与老广告效果无差异

H1：新广告效果优于老广告

#老广告点击率0.02，新广告1000次广告曝光获得23次点击是否明显优于老广告binom.test(x =23,n = 1000,p = 0.02,alternative ="greater",conf.level = 0.95 )

p-value = 0.2778>0.05，在0.95的置信区间下接受原假设H0。新广告与老广告在点击率上没有显著差异。

#1000次访问0.02点击率下差异显著的临界值qbinom(p = 0.95,size = 1000,prob = 0.02)

[1] 28

新广告在1000次广告曝光中点击量需要提升到28次以上才能明显优于老广告的效果。

泊松分布检验

假设一次市场推广活动中前一个小时有50人注册，后一个小时有60人注册，后一小时的注册人数是否明显高于前一小时？

H0：前一小时与后一小时注册人数无差异

H1：后一小时注册用户数量高于前一小时

#上一小时50人注册，下一小时60人注册，后一小时是否显著高于前一小时poisson.test(x = 60,T = 50,alternative ="greater",conf.level = 0.95)

p-value = 0.09227>0.05，在0.95的置信区间下接受原假设H0，后一小时注册人数与前一小时无差异。

#与上一小时50人注册差异显著的临界值

qpois(0.95,lambda=50)

[1] 62

后一小时的注册用户数需要提升到62以上才能明显高于前一小时的注册用户数。

单样本t检验

假设某流量渠道的目标是每日带来150个咨询，在过去的一周带来的咨询用户数量分别为229,164,121,137,145,127,123，我们是否能认为该渠道已经达到目标，即每日的平均咨询量大于150？

这里使用单样本t检验，首先建立假设。

H0：每日平均咨询量不大于153，未达到目标。

H1：每日平均咨询量大于153，达到目标。

#将过去一周咨询用户数量赋给XX=c(229,164,121,137,155,127,143)#计算过去一周咨询量的均值mean(X)

[1] 153.7143

#过去一周咨询用户数量是否达到目标

t.test(X,alternative ="greater",mu=153,conf.level = 0.95)

p-value = 0.4801>0.05，在0.95的置信区间下接受原假设H0，流量渠道的咨询量没有达到目标。

双样本t检验

假设两个流量渠道在过去的一周分布为网站带来咨询用户，这两个流量渠道带来的咨询用户数量是否有显著差异？

这里使用双样本t检验，首先建立假设。

H0：两个流量渠道带来的咨询用户数量没有显著差异。

H1：两个流量渠道带来的咨询用户数量存在有显著差异。

#流量渠道1带来的咨询用户数量赋值给

XX=c(229,164,121,137,155,127,143)

#流量渠道2带来的咨询用户数量赋值给

YY=c(175,120,187,144,117,184,135)

进行双样本t检验之前先进行方差检验，确定两组样本方差是否相同。 H0：两个总体方差相同 H1：两个总体方差不同

#方差检验，确定两个流量渠道的咨询量是否相同

var.test(x = X,y = Y,conf.level =0.95)

p-value = 0.6469>0.05，在0.95的置信区间下接受原假设H0，两个总体方差相同。进行等方差t检验。

#等方差t检验，两个流量渠道带来的咨询用户数量是否有差异

t.test(X,Y,var.equal=TRUE,alternative ="two.sided")

p-value = 0.9125>0.05，接受原假设H0，在0.95的置信区间下两个流量渠道的咨询用户量没有显著差异。

成对样本t检验

假设网站对咨询流程进行了优化并进行了测试，那么改版后的效果是否明显优于改版前？

这里使用成对t检验，首先建立假设。

H0：改版后的效果与改版前无差异

H1：改版后的效果明显优于改版前

#改版前注册用户量赋给before

before=c(229,164,121,137,155,127,143)

#改版后注册用户量赋给after

after=c(217,284,155,190,158,170,180)

#改版前的咨询量是否小于改版后的咨询量

t.test(before-after,alternative ="less",conf.level = 0.95)

p-value = 0.02362<0.05，拒绝原假设H0，接受备择假设H1。在0.95的置信区间下改版后的效果明显优于改版前。

卡方检验

假设广告创意A1315次访问，65次转化，转化率4.94%，广告创意B939次访问，54次转化，转化率5.75%。广告创意B的效果是否优于广告创意A？

这里使用卡方检验，首先建立假设。

H0：两个广告创意的效果无差异

H1：广告创意B的效果优于广告创意A

对源数据近整理，广告创意A1250次未购买，65次购买，广告创意B885次未购买，54次购买。以此建立列联表。

#创建列联表X=c(1250,885,65,54)

dim(X)=c(2,2)

#使用卡方检验chisq.test(X,correct =FALSE)

p-value = 0.3978>0.05，在0.95的置信区间下接受原假设H0，两个广告创意效果没有显著差异。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试详情；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试详情；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

假设检验 R语言统计分析

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

使用R进行统计分析—假设检验

二项分布检验

泊松分布检验

单样本t检验

双样本t检验

成对样本t检验

卡方检验

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】用 Power BI 制作地图热力图：基于经纬 ...

【CDA干货】解析 insert into select 是否会锁表： ...

CDA 数据分析师的工作范围解析

从 CDA LEVEL II 考试题型看 Python 数据分析要点 ...

【CDA干货】用 Python 开启数据分析之旅：从基础到 ...

【CDA干货】鸢尾花判别分析：机器学习中的经典实践 ...

【CDA干货】解析 response.text 与 response.conten ...

【CDA干货】解析神经网络中 Softmax 函数的核心作用 ...

CDA数据分析师证书考取全攻略

【CDA干货】左偏态分布转正态分布：方法、原理与实 ...

自媒体创业者：快把握风口，利用CDA＋AI新模式，轻 ...

CDA数据分析能力+AI=传统企业主的新生存法则 ——企 ...

CDA 数据分析师的职业生涯规划：从入门到卓越的成长 ...

【CDA干货】MySQL执行计划中rows的计算逻辑：从原理 ...

CDA认证基建：AI时代企业内训乘风破浪的 “超级引擎 ...

35岁+ 职场突围战：2025年最该考的证书为什么是CDA? ...

CDA 数据分析师报考条件详解与准备指南 ...

CDA数据分析师证书：AI时代的职场“黄金通行证” ...

AI时代，人人都该是CDA数据分析师

CDA 数据分析师：数据时代的价值挖掘者 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载