如图:
简单随机抽样最简单,需要考虑的问题最少。但是往往由于人难以保持完全的客观,因此需要辅助以随机数等形式进行,以保证每个个体被抽中的可能性尽量相同。
系统抽样在考虑到人力和时间成本的基础上,对简单随机抽样进行了调整,通过编号后等距离选择的方式进行。但是对于某些具有一定特征的群体,这样的方式和简单随机抽样一样,可能会造成样本特征过于集中或者缺失,不能很好地代表总体。
分层抽样,可以很好地解决这个问题。对于有明显特征区分的总体,分层抽样先通过不同层进行区分。然后根据实际情况对每层进行一定数量的抽取。因此,这也是应用最多的一种概率抽样方法。
分段抽样主要用来对大规模的总体进行抽样,但是由于每一步都会进行随机抽样,所以信息有所损耗。
一般来说,对同样的统计指标,分层抽样、分段抽样获取的样本标准差要略小于简单随机抽样和系统抽样。但是这并不能直接推断出这两种方法的抽样误差更小。大家需要特别注意。
三个资料Q群下载不了也转发不了,先放这里Fine_tuning.zipLangChain.zipdata_clear.rar