用各种机器学习算法预测上海房价,从链家网爬取的上海市各二手房数据进行训练,非线性决策树优于线性回归优于神经网络
摘要:
本文主要分析影响房价的因素,数据来源为链家网,机器学习模型的使用中,采用了三种线性模型,一种非线性模型,最后得出的结论是房子的大小,房子的位置,房子的建造年份以及房子的高度对房价影响较大。
问题描述
现在房价居高不下,特别是上海等一线城市,房价更是高的离谱,那么在决定一个房子的价格中,哪些因素占了主要的地位,如何让想买房的人快速获取大概的房价信息。那么本文介绍的就是如何用机器学习去训练上海房价信息并生成模型然后进行分析的过程。
数据收集及处理
数据源选择
经过在网上对几个房价信息网的比较,
1