zxq997

2018-11-20   阅读量: 1582

数据分析师

数据中的概率抽样与非概率抽样

扫码加入数据分析学习群

当我们需要获取一手数据的时候,一种常用的方式就是抽样调查。抽样调查不止在传统行业中比较常用,在现在互联网企业中也时常会用到。比如一些优惠活动或者特定客群营销等方案的测试,就需要用到抽样的方式选择测试群体。

在做抽样调查时,我们都希望尽可能地减少误差,让抽样的样本能够充分代表整体的特征。那么误差和哪些因素相关呢?抽样误差(Sampling Error)的大小,主要由样本容量的大小和抽样方式来决定。

一般,我们认为抽样可以分类两类:一类我们叫做概率抽样(Probability Sampling),也叫作客观抽样。第二类,我们叫做非概率抽样(Non-probability Sampling),也叫作主观抽样。下面我们来分别介绍这两种抽样方法。

概率抽样,顾名思义,是一种基于概率的抽样方式,因此也被称为客观抽样。从理论的角度来说,概率抽样是符合科学和统计原则的,抽样误差可以估计。也是在可能的情况下,最优先被推荐使用的抽样方法。但是,精确度高的方法,往往操作的复杂度和耗费的成本也会相对偏高。概率抽样,虽然可以避免主观判断带来的谬误,但是它常常受限于项目经费、时间和保密性等原则,从而难以实际使用。

和概率抽样相反,非概率抽样是一种简单、易使用的抽样方式。它主要通过抽样者的判断,包括对样本特征的判断和对项目成本的考量,综合特殊的要求或者设定,最终选择合适的样本。因此,这种方法会受到主观因素的影响,不符合统计科学的原则,抽样误差是无法估计和计算的。但是在实际应用中,大量的案例还是证明了非概率误差依然有一定的有效性。在样本量充足的前提下,通过设定简单的配比,以及选择有经验的抽样者,基本上可以保证抽样结果的有效性。而且由于非概率抽样比较容易重复操作,因此用非概率抽样反复进行同一试验,结果往往也有趋同性。另外,这一抽样方式,虽然无法衡量抽样误差,但是由于抽样过程可以进行设计和控制,因此可以更简单有效地控制非抽样误差(Non-sampling Error)

总结来说,概率抽样和非概率抽样,我们可以通过以下的表格进行区别:

添加CDA认证专家【维克多阿涛】,微信号:【cdashijiazhuang】,提供数据分析指导及CDA考试秘籍。已助千人通过CDA数字化人才认证。欢迎交流,共同成长!
0.0000 0 0 关注作者 收藏

评论(0)


暂无数据

推荐课程

推荐帖子