我们将介绍如何使用R软件实现常见的几种抽样方法,它们分别是:简单随机抽样、分层抽样、系统抽样、PPS抽样、整群抽样和多阶段抽样。下文的介绍中主要包含两方面的内容,抽样和估计。使用的软件是R-3.2.0。
进行抽样主要使用的是sampling包,首先需要下载并加载sampling包。使用到的函数主要有srswor,strata,UPsystematic,UPmultinomial,UPbrewer,cluster,mstage,inclusionprobabilities,getdata.
抽样的实例数据是agpop文件。
agpop数据文件的介绍:agpop.xls文件中一共有美国3078个县级或与县级规模相当的农场数据,包含了1982,1987,和1992年每个县所拥有的农场个数(farms),耕地面积(acres),耕地面积小于9英亩的小农场数量(smallf),耕地面积大于1000英亩的大农场数量(largef)的数据。
原始数据集中存在缺失数据,首先在R中直接对数据的缺失值进行处理。进行剔除处理后的完整数据集有3041个观测,18个变量。
2021-08-14 18:03:38
12.03MB
ppt
1