杭州二手房源分析
一、项目主题
分析杭州历年城区内小区房价变化,根据房地产知识定义楼盘,为用户购房提供决策参考。(可分析其他城市,替换第一个城区链接即可。)
如何评估房子性价比。
二手房源如何定价。
房价预测趋势。
楼盘开发预测。
房源网站数据全,但是量过大,我们只针对小区这一维度,给出纵向和横向对比的维度数据,做分析。
二、项目开发
1.数据爬虫
获取房天下的数据源,数据入库。
指标:小区名,房价,经度,纬度,板块评级,物业评级,活跃度评级,教育评级,搜索热度。
待分析出的指标:同比,环比,分类,综合评分,预测房价。
(1)分析网站结构
主城区链接:get请求
商业区:get请求
小区:get请求
历年:get请求
requests请求数据接口,selenium获取页面静态数据。
selenium有点慢,5小时可爬到杭州小区全部数据。中间会有反爬机制,弹出验证码页面,导致查不到页面元素,
1