CDA持证人阿涛哥

2023-06-19   阅读量: 477

统计学 数据分析师

CDA数据分析学习笔记之统计学抽样

扫码加入数据分析学习群

抽样概述

在统计学中,抽样(Sampling)是一种推论统计方法,它是指从目标总体(Population,或称为母体)中抽取一部分个体作为样本(Sample),通过观察样本的某些属性,依据所获得的数据对总体的数量特征得出具有一定可靠性的估计判断,从而达到对总体的认识。


概率抽样方法

简单随机抽样(simple random sampling),也叫纯随机抽样。从总体N个单位中随机地抽取n个单位作为样本,使得每一个容量为样本都有相同的概率被抽中。特点是:每个样本单位被抽中的概率相等,样本的每个单位完全独立,彼此间无一定的关联性和排斥性。简单随机抽样是其它各种抽样形式的基础。通常只是在总体单位之间差异程度较小和数目较少时,才采用这种方法。


系统抽样(systematic sampling),也称等距抽样。将总体中的所有单位按一定顺序排列,在规定的范围内随机地抽取一个单位作为初始单位,然后按事先规定好的规则确定其他样本单位。先从数字1到k之间随机抽取一个数字r作为初始单位,以后依次取r+k、r+2k……等单位。这种方法操作简便,可提高估计的精度。


分层抽样(stratified sampling)。将抽样单位按某种特征或某种规则划分为不同的层,然后从不同的层中独立、随机地抽取样本。从而保证样本的结构与总体的结构比较相近,从而提高估计的精度。

整群抽样(cluster sampling)。将总体中若干个单位合并为组,抽样时直接抽取群,然后对中选群中的所有单位全部实施调查。抽样时只需群的抽样框,可简化工作量,缺点是估计的精度较差。


非概率抽样方法

方便抽样(Convenience Sampling)。调查者以自己方便的方式抽取偶然得到的样本,最典型的方便抽样是“街头拦人法”。方便抽样的优点是易于实施,代价较小,缺点是样本代表性差,有很大的偶然性。


定额抽样(Quota Sampling)。调查者先将总体按某种特征划分成不同的组,然后在配额内以主观判断选定样本作为研究对象。定额抽样和分层抽样的相同之处是对总体进行分组,不同之处是分层抽样按概率原则在层内抽选样本,而定额抽样选取样本是主观的。定额抽样的优点是能够缩小抽样范围,减少抽样成本,缺点是确定额度困难,需多次探索。


判断抽样(Judgement Sampling)。研究人员根据调查目的和主观经验,从总体中选择最具代表性的样本。判断抽样的优点是可以用于总体难以确定的研究对象,缺点是受研究人员的主观倾向性影响大,一旦主观判断失误, 则易引起较大的抽样偏差。


滚雪球抽样(Snowball Sampling)。先选取若干符合特征的样本构成最初的调查对象,然后依靠他们提供新的调查对象,随着调查的推进,样本如同滚雪球般由小变大,滚雪球抽样方法的优点是能够很方便地找到被调查者,用于探索性研究,缺点是样本之间必须存在联系且愿意保持和提供这种联系。


题目:

9652ddc0409a163f0787923d0454db8.jpg


答案: A


解析:

A 选项:抽样误差是随机抽样调查中偶然发生的代表性误差,是正确的说法。抽样误差是由于抽样方法的随机性和样本容量的大小等因素导致的估计值与总体值之间的差异。

B 选项:抽样误差的大小与样本单位数成正比关系是错误的说法。抽样误差的大小与样本单位数成反比关系,即样本容量越大,抽样误差越小。

C 选项:简单随机抽样比分层抽样误差大是错误的说法。分层抽样可以减小抽样误差,因为分层抽样可以将总体分成若干层,从每一层中随机抽取样本,从而保证每一层

都有代表性。

在样本总量一样的情况下,简单随机抽样比分层抽样误差可能更大。因为简单随机抽样不考虑总体的分层结构,可能导致样本不够代表性,而分层抽样可以通过考虑总体的

分层结构,从每一层中随机抽取样本,从而保证每一层都有代表性,减小抽样误差。但是,如果总体没有分层结构,那么简单随机抽样和分层抽样的抽样误差是相当的。

D 选项:重复抽样比不重复抽样误差小是错误的说法。重复抽样可以增加估计值的稳定性,但并不能减小抽样误差。


添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子