Nyc-Taxi-Kaggle-挑战 目标 Kaggle竞赛预测纽约出租车的行驶时间。 该项目的报告在capstone.pdf。 (在这个项目中,我提供了许多链接,如果您是初学者,可以通过这些链接来弄清楚您的概念,如果不理解的话,可以通过project和readme中提供的链接和pdf来了解。) 问题陈述 在本报告中,我们使用来自纽约市出租车和高级轿车委员会的数据来考察Kaggle竞赛,该竞赛要求竞争对手预测纽约市出租车旅行的总行驶时间(trip_duration)。 Kaggle提供的数据是作为CSV文件提供的结构化数据。 CSV文件中的数据包括多种格式:时间戳,文本和数字数据。 这是回归分析,因为输出(总行驶时间)是数字。 我将使用几种机器学习方法来完成预测任务,这些方法是线性回归,k最近邻回归,随机森林和XGBoost。 将使用均方根对数误差对模型进行评估。 总览 我使用Jupyter_Notebook在dekstop上执行此项目,并且在使用python的远程服务器上也无需使用Jupyter_notebook来执行。 软件和库 Python 3 Scikit-learn:Pyt
2022-06-05 16:04:07 23.28MB python machine-learning deep-learning random-forest
1
本文档介绍了2007年2月20日中国上海出租车GPS报告 鄙人在数学建模过程中用到了此数据集,故发布出来供大家下载。
1
如何使用AWS EC2 Hadoop集群处理200 GB数据 存储200 GB的NYC出租车数据集并部署Cloudera Hadoop集群以对其进行可视化。 使用Python Datashader绘制和可视化Hadoop大型数据集 没有Datashader的可视化 工作流程概述 使用数据着色器 最终可视化
2021-12-23 11:05:42 1.68MB jupyter-notebook pyspark dask datashader
1
上海GPS出租车数据集
2021-08-12 18:02:55 84.99MB dataset
1
包括南京,成都,西安,北京的出租车数据集
2021-08-12 18:02:54 8.43MB dataset
1
北京市出租车的相关数据集合,含有不同地点打车难易程度,
2021-04-18 16:27:49 586KB 北京市出租车 数据集
1
2007上海GPS出租车数据集,7月20日数据集,数据内容,出租车编号,时间,经纬度,夹角,瞬时速度,载客状态.网上搜无意中下到的,分享下载下。
2021-04-12 15:07:21 38.52MB 出租车数据集
1
由微软研究研究提供的出租车公开数据集,郑宇博士在出租车领域发表论文使用的数据集。
2019-12-21 18:49:33 146.12MB 微软 出租车数据集 轨迹数据集 数据集
1
2007年上海出租车7月20日数据集,数据内容,出租车编号,时间,经纬度,夹角,瞬时速度,载客状态
2019-11-21 13:42:16 33.35MB gps taxi
1
2007年的上海GPS出租车数据集,特征包括:出租车ID、时间、经度、维度、夹角角度、出租车的瞬时速度和出租车载客状态。接近10万条数据,并且附上了LogViewer工具来快速查看每一个数据集。本人学术研究使用过的数据集,绝对可靠!
2019-09-12 19:41:47 38.52MB 上海 数据集 出租车 GPS
1