加州住房数据集
开发了机器学习模型来预测加利福尼亚住房数据集的中位数房屋价值特征。 使用了三种算法:线性回归,XGBoost和TensorFlow / Keras神经网络。
在模型训练之前进行了要素工程,包括Z分数归一化,对数缩放,要素添加(总卧室与总房间的比率),要素修剪和要素合并以及经度和纬度的交叉。
对于所有这三种算法,均使用工程特征的不同组合绘制R平方图,以观察有效性。 然后,根据算法以图形方式编辑这些图,以便于比较。
下面提供了每种算法的图例,这些图例将数值链接到一组工程特征。 该存储库中提供的机器学习脚本与图例重合,例如,XGBoost的“ 1:无特征工程”与XGBoost文件夹中的“ californiaHousingXGBoost1.py”重合。
R平方图位于每个父算法文件夹内的各个“图”文件夹中。 其中提供了单独的.svg图形,用于以下图例中列出的功能工程集的所有
2021-10-21 20:30:58
33.66MB
Python
1