上传者: 38607026
|
上传时间: 2021-11-18 15:53:48
|
文件大小: 186KB
|
文件类型: -
项目背景:提供两年的每小时租金数据。训练集是每个月的前19天,而测试集是每月的20号到月底。必须仅使用租借期之前的可用信息来预测测试集涵盖的每个小时内租用的自行车总数。
一、载入数据
1.1收集数据
一般而言,数据由甲方提供。若甲方不提供数据,则需要根据相关问题从网络爬取,或者以问卷调查形式收集。本次共享单车数据分析项目数据源于Kaggle [https://www.kaggle.com/c/bike-sharing-demand/data]。
1.2 载入数据
// 载入工具包
import numpy as np
import pandas as pd
import matplotlib.