项目背景:运用回归模型进行房价预测。影响房价的因素有很多,在本题的数据集中有79个变量几乎描述了爱荷华州艾姆斯(Ames,lowa)住宅的方方面面,要求预测最终的房价。
数据介绍:使用BartdeCock于2011年收集 [DeCock,2011], 涵盖了 2006−2010 年期间亚利桑那州埃姆斯市的房价。
技术栈:
特征工程(Creative feature engineering)
回归模型(Advanced regression techniques like random forest and gradient boosting)
常规模型融合:多模型平均融合、
高阶模型融合方法:bagging、boosting
目标:
预测出每间房屋的价格,对于测试集中的每一个ld,给出变量SalePrice相应的值。
算法通过计算平均预测误差来衡量回归模型的优劣。平均预测误差越小,说明回归模型越好。