包括了房屋的经度、房屋的纬度、房龄、房间个数、卧室个数、街区内人口、街区内家庭总数、收入、房屋价值,和sklearn中的california数据集相同,可直接通过pandas.read_csv读取即可,适合sklearn无法正常加载的情况下使用,其中加载代码如下 ```python from sklearn.datasets.california_housing import fetch_california_housing housing = fetch_california_housing() ```
2023-01-04 15:28:17 1.98MB 数据集 sklearn
其中包含了由D·哈里斯和慕·鲁宾菲尔德两位在1978年收集的关于波士顿郊区住房的信息。
2022-01-26 09:09:14 12KB 机器学习
1
根据房屋租赁信息创建的日期和其它相关特征,预测该租赁信息预计被查询点击的次数,进而提供欺诈控制和信息质量监测,使房屋业主和代理人更好的理解租户的需求和偏好。
1
加州住房数据集 开发了机器学习模型来预测加利福尼亚住房数据集的中位数房屋价值特征。 使用了三种算法:线性回归,XGBoost和TensorFlow / Keras神经网络。 在模型训练之前进行了要素工程,包括Z分数归一化,对数缩放,要素添加(总卧室与总房间的比率),要素修剪和要素合并以及经度和纬度的交叉。 对于所有这三种算法,均使用工程特征的不同组合绘制R平方图,以观察有效性。 然后,根据算法以图形方式编辑这些图,以便于比较。 下面提供了每种算法的图例,这些图例将数值链接到一组工程特征。 该存储库中提供的机器学习脚本与图例重合,例如,XGBoost的“ 1:无特征工程”与XGBoost文件夹中的“ californiaHousingXGBoost1.py”重合。 R平方图位于每个父算法文件夹内的各个“图”文件夹中。 其中提供了单独的.svg图形,用于以下图例中列出的功能工程集的所有
2021-10-21 20:30:58 33.66MB Python
1
nycdb 让我们研究房东! 纽约市正面临住房危机。 一些绝望地离开了他们的建筑物,让他们的房客在冬天没有热量。 其他人则合法或非法驱逐其房客,以转移建筑物并从中产阶级化中获利。 经济适用房是一种稀缺资源。 想要在斗争中使用数据的居民,律师,租户和组织者会转向专有数据库和资源,例如PropertyShark,这些房地产和资源是为房地产设计的,或者与CSV和城市网站的打印输出抗衡。 nycdb旨在通过提供一个包含房屋数据的即用型数据库,为想要志愿投入时间的技术人员和研究人员提供帮助,以捍卫城市免受房地产业的侵害。 nycdb是一个python程序,可将以下公共数据集下载,处理并将其加载到p
2021-05-13 10:08:05 795KB nyc data database psql
1
机器学习算法常用数据集
2021-01-30 20:03:24 76B 机器学习
1