加州住房
来源
此数据集是可从(波尔图大学)获得的“加利福尼亚住房”数据集的修改版本。 LuísTorgo从StatLib存储库(现已关闭)中获取了它。 数据集也可以从StatLib镜像下载。
该数据集出现在1997年Pace,R.Kelley和Ronald Barry题为“稀疏空间自回归”的论文中,该论文发表在《统计和概率快报》杂志上。 他们使用1990年加利福尼亚人口普查数据构建了该数据。 每个普查区组包含一行。 街区小组是美国人口普查局发布样本数据的最小地理单位(街区小组通常人口为600至3,000人)。
调整
此目录中的数据集几乎与原始数据集相同,但有两个区别:
从total_bedrooms列中随机删除了207个值,因此我们可以讨论如何处理丢失的数据。
添加了另一个名为ocean_proximity类别属性,该属性(非常粗略地)指示每个块组是在海洋附近,在湾区附近,在内陆还
1