【R语言】单一样本推断问题-CDA数据分析师官网

热线电话：13121318867

【R语言】单一样本推断问题

2017-05-31

【R语言】单一样本推断问题

非参数统计概念：

在实际问题中，对数据的分布形式和统计模型难以作出比较明确的假定，最多只能对总体的分布做出类似于连续性型分布或者对某点对称等一般性假定。这种不假设总体分布的具体形式，尽量从数据（样本）本身获得所需要的信息，通过估计而获得分布的结构，并逐步建立对事物的数学描述和统计建模的方法称为非参数方法。

单一样本的推断问题：

符号检验

符号检验所关心的就是通过符号“+”“-”的个数来进行统计推断

eg：假设某城市16座欲出售的楼盘均价（单位：百元 /平方米）

36 32 31 25 28 36 40 32 41 26 35 35 32 87 33 35

问：该地盘楼盘价格是否与媒体公布的3700元/平方米说法相符？

分析：

总体均值的点估计是样本均值，总体中位数的点估计是样本中位数，由于中位数的稳健性，将37理解为总体的中位数，则假设问题为：

H0：M=37 H1: M不等于37（待检验的中位数值）

假设：

S+：位于37右边的个数 S-：位于37左边的个数

令K=min{S+，S-}，且K服从p=0.5的二项分布

R代码:

##1.S-为检验统计量

sign1.test = function(x,pi,q0){
s1 = sum(x<q0) #S-的个数
s2 = sum(x>q0) #S+的个数
n = s1+s2
p1 = pbinom(s1,n,pi) ### 取检验统计量K=S-，计算 P（K<=s1）
p2 = 1-pbinom(s1-1,n,pi)   ### 计算 P（K>=s1）
if(p1 < p2){ m1 = "one tail test:H1: Q > q0"
}else{
      m1 = "one tail test:H1: Q < q0"
  }
p.value = min(p1,p2)
m2 = "two tails test"
p.value2 = 2*p.value
list(sign.test.type = m1,p.values.of.one.test = p.value,p.value.of.two.tail.test = p.value2)
}

##以上便构建了符号检验的函数，接下来可以直接调用

data=c(36,31,25,28,36,40,32,41,26,35,35,32,87,33,35,32)##赋值

x=median(data)##获取样本中位数

sign1.test(data,0.5,37)

结果解读：

p=0.02127<0.05(显著性水平)，拒绝H0，认为该地盘楼盘价格是否与媒体公布的3700元/平方米存在显著差异。

趋势检验

对于趋势分析，我们用一些数对来反映前后数据的变化。为保证数对同分布，前后两个数的间隔应该固定；为保证数对不受局部干扰，前后两个数的间隔应该较大。Cox-Staut趋势检验，是以数列中位于中间位置的数为拆分点，前后两两组成数对。

例：一个住宅小区的夜间噪音长期一直保持在30分贝。后来附近有建筑工地施工。数据是连续12天夜间在该小区所测得的噪声水平（分贝）。

30,31,33,35,31,30,68,60,65,67,66,64

请问：该建筑工地是否提高了小区的噪声水平？

建立假设：

Ho:该建筑工地没有提高小区的噪声水平

H1：该建筑工地提高了小区的噪声水平

检验统计量选取：

S=min{S+，S-}

S+：每一数对前后两值之差为正的个数

S-：每一数对前后两值之差为负的个数

R代码：

CS.test = function(x){

m = length(x)

c = if(m/2-round(m/2)==0){m/2}else{(m+1)/2} ### 此处亦可用floor(m/2)代替round(m/2)

d = if(m/2-round(m/2)==0){x[1:c]-x[(c+1):m]}else{x[1:(c-1)]-x[(c+1):m]}

n1 = length(d[which(d > 0)]) ### n1 = length(which(d > 0))

n2 = length(d[which(d < 0)])

n = n1+n2

s1 = sum(sign(d)== 1)

s2 = sum(sign(d)== -1)

if(n1 > n2){

m1 = "one tail test:H1: decreasing"

p.value = pbinom(n2,n,0.5)

}else{

m1 = "one tail test:H1: increasing"

p.value = pbinom(n1,n,0.5)

}

m2 = "two tails test"

s = min(s1,s2)

p.value2 = 2*pbinom(s,n,0.5)

if(n1==n2){p.value = 0.5;p.value2 = 1}

list(sign.test.type = m1,p.values.of.one.test = p.value,p.value.of.two.tail.test = p.value2)

}

上述就是Cox-Staut检验的算法代码

代入数据：

x=c(30,31,33,35,31,30,68,60,65,67,66,64)

结果分析：

单边检验P=0.015625<0.05（显著性水平）

故拒绝H0，认为该建筑工地提高了小区的噪声水平。

CDA数据分析师考试相关入口一览（建议收藏）：

▷ 想报名CDA认证考试，点击>>> “CDA报名” 了解CDA考试详情；

▷ 想学习CDA考试教材，点击>>> “CDA教材” 了解CDA考试教材；

▷ 想加入CDA考试题库，点击>>> “CDA题库” 了解CDA考试题库；

▷ 想了解CDA考试含金量，点击>>> “CDA含金量” 了解CDA考试详情；

▷ 想了解CDA院校合作，点击>>> “院校合作” 了解咨询CDA院校合作；

R语言

数据分析咨询请扫描二维码

若不方便扫码，搜微信号：CDAshujufenxi

上一篇图论在大数据分析中的作用！

下一篇CDA认证再升一档！与国家共同推进大数据人才培养标准教育事业！

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

京公网安备 11010802034615号经营许可证编号：京B2-20210330

联系电话：13321103290 (微信同号)

客服在线

立即咨询

客服在线

立即咨询

免密码登录

提交首次登录验证后自动注册

【R语言】单一样本推断问题

数据分析师考试动态

CDA报考指南

数据分析学习

数据分析师资讯

【CDA干货】OSM指标体系：自上而下拆解逻辑、搭建流 ...

【CDA干货】选择统计方法前最重要的核心工作：避免9 ...

从“零散明细”到“多维洞察”：CDA数据分析师视角 ...

【CDA干货】问卷效度高与后续因子分析：逻辑关系、 ...

CDA持证人专访：唐一楠谈应届生数据分析就业与学习 ...

从“静态数据”到“动态资产”：CDA数据分析师视角 ...

【CDA干货】SQL统计月度每日夜间数据：口径定义、多 ...

【CDA干货】特征置换重要性分析：原理、计算流程、 ...

从“单元格”到“字段”：CDA数据分析师视角下的表 ...

CDA持证人专访：张继荣谈销售转岗数据分析的追梦路 ...

【CDA干货】Excel卡方检验实操指南：原理、步骤、结 ...

从“单元格”到“洞察”：CDA数据分析师视角下的表 ...

【CDA干货】Excel透视表数据直接跨单元格相乘：风险 ...

从“行列规范”到“业务洞察”：CDA数据分析师视角 ...

数据分析师就业难不难？薪资待遇如何？考 CDA 证书 ...

CDA 持证人专访：刘燕谈数据分析师业务落地与项目实 ...

【CDA干货】数据清洗核心技术体系：缺失值填充、去 ...

从“数据”到“洞察”：CDA数据分析师视角下的统计 ...

【CDA干货】指标生命周期全链路管理：从规划设计到 ...

【CDA干货】留存运营指标体系：计算口径、分析方法 ...

CDA教育闭环

常见问题

关于我们

CDA数据分析师公众号

CDA考试中心小程序

CDA数据分析师App下载