上传者: 42130889
|
上传时间: 2021-12-13 13:48:56
|
文件大小: 1KB
|
文件类型: -
人口普查_收入_项目
此数据是由Ronny Kohavi和Barry Becker(数据挖掘和可视化,Silicon Graphics)从1994年人口普查局数据库中提取的。 使用以下条件提取了一组合理的干净记录:((AAGE> 16)&&(AGI> 100)&&(AFNLWGT> 1)&&(HRSWK> 0))。 预测任务是确定一个人每年的收入是否超过5万美元。 fnlwgt(最终权重)的说明当前人口调查(CPS)文件中的权重被控制为对美国平民非机构人口的独立估计。 这些由人口普查局的人口司每月为我们准备。 我们使用3套控件。 它们是:每个州的16岁以上人口的单个单元格估计。 通过年龄和性别控制西班牙裔起源。 通过种族,年龄和性别进行控制。 我们在加权程序中使用了所有三组控件,并通过它们进行了6次“遍历”,以便最终返回到所使用的所有控件。 估计一词是指通过创建具有特定人口社会经济特征的“