前几天一直在研究 Python 爬虫技术,只为从互联网上获取数据集。
本文就是利用前几天学到的爬虫知识使用 Python 爬取天气数据集,并做的一期讨论日期与最低气温能是否是最高气温的影响因素,进而判断能否精确预测第二天的天气情况。
由于本文开始写作与5月9日,当天想预测第二天也就是5月10日的气温数据,但由于内容较多,到10日下午才写完。所以数据预测的内容有些“陈旧”,还请读者多多包涵。
目录
1 天气数据集爬取
2 数据可视化
3 模型预测数据
3.1 单变量线性回归
模型一:单变量线性回归模型
3.2 多变量线性回归
模型二:基于LinearRegression实现的多变量线性回归模型
1