上传者: 42137028
|
上传时间: 2021-10-14 23:38:34
|
文件大小: 326KB
|
文件类型: -
Predict-pm2.5
Abstract
Course: Data Mining Research & Practice (NCTU)
This project is the 4th homework of this course.
The topic of this project is to handle the series data.
Requirements
请使用10和11月资料当作训练集,12月之资料当作测试集,
将前六小时的污染物数据做为特征,未来第一个小时/未来第六个小时的pm2.5数据为预测目标
使用两种模型Linear Regression 和Random Forest Regression 建模并计算MAE
资料前处理
a. 取出10.11.12月资料
b. 缺失值以及无效值以前后一小时平均值取代(如果前一小时仍有空值,再取更前一小时)
c. NR表示无