纽约市出租车行程时间
该存储库包含我在第一个Tableau项目中创建的分析和可视化。
如果感觉更好,可以在查看。
该项目也存在于NYTaxiTrip.twb此存储库中。
关于
该项目包含所选数据库的整个研究,每种图形表示的原因以及所得出的结论。
涵盖的主题:
特征工程
数据清理
特征关系
数据集
该数据库取自Kaggle的比赛。
在这场比赛中,Kaggle挑战您建立一个模型,该模型可以预测纽约市出租车旅行的总行驶时间。 您的主要数据集是纽约市出租车和豪华轿车委员会发布的数据集,其中包括接送时间,地理坐标,乘客人数以及其他几个变量。
选择的基地是包含1458644旅行记录的训练基地( train.csv )。
基本包含以下属性:
id-每个行程的唯一标识符vendor_id-指示与行程记录关联的提供者的代码
Pickup_datetime-启用电表的日期和时间dropoff_
1