纽约市出租车行程时间 该存储库包含我在第一个Tableau项目中创建的分析和可视化。 如果感觉更好,可以在查看。 该项目也存在于NYTaxiTrip.twb此存储库中。 关于 该项目包含所选数据库的整个研究,每种图形表示的原因以及所得出的结论。 涵盖的主题: 特征工程 数据清理 特征关系 数据集 该数据库取自Kaggle的比赛。 在这场比赛中,Kaggle挑战您建立一个模型,该模型可以预测纽约市出租车旅行的总行驶时间。 您的主要数据集是纽约市出租车和豪华轿车委员会发布的数据集,其中包括接送时间,地理坐标,乘客人数以及其他几个变量。 选择的基地是包含1458644旅行记录的训练基地( train.csv )。 基本包含以下属性: id-每个行程的唯一标识符vendor_id-指示与行程记录关联的提供者的代码 Pickup_datetime-启用电表的日期和时间dropoff_
2021-11-14 14:11:20 58.76MB tableau tableau-desktop tableau-workbooks Python
1
该数据集描述了2019年纽约州纽约市的上市活动和指标。 New_York_City_.png AB_NYC_2019.csv
2021-11-13 16:49:07 2.41MB 数据集
1
NYC_Traffic_Safety_Project 我整理并整理了我所做的第一个项目的代码(与同学们组成一个团队,归功于陈书效,赖小亚,罗旭丹,钟敏喜和李嘉颖)。 此仓库包含纽约市地图和事故的原始数据,还包括用于进行预处理并将其输入到CNN模型中的Python代码。 背景 在城市中,交通事故正成为越来越普遍的伤害和死亡原因。 根据NYC Open Data的数据,仅在纽约,2018年过去几天每天平均发生622起交通事故。 因此,预测未来事故的能力(例如,地点,时间或方式)不仅对公共安全利益相关者(例如,警察,自治企业)而且对运输管理人员和个人旅行者都非常有用。 许多学者对交通事故的原因进行了大量研究,但很少关注道路设计。 但是,在许多情况下,每年都会设计出令人难以置信的十字路口,导致事故发生。 我们做了什么 我们训练了一个卷积神经网络(CNN),使用十字路口的卫星图像作为特征,附近交通
2021-10-02 14:33:35 16.21MB Python
1
纽约市财产回归 基于纽约数据的房地产价格预测的真实案例研究。 项目背景 以在纽约州投资于房屋和公寓的房地产投资信托(REIT)为例,房地产投资信托(REIT)业务的一部分是试图预测房地产在出售前的公平交易价格。 他们这样做是为了校准内部定价模型并保持市场脉动。 在此项目中,数据集表示纽约州一个小县内房屋,公寓和公寓的投资。 当前的工作解决方案 房地产投资信托目前使用第三方评估服务,以其自身的专业知识估算房地产价格。 在实践中,各个评估员的技能水平差异很大。 为了估算错误定价范围,房地产投资信托基金进行了试运行,以将实际交易价格与评估师的估算值进行比较。 结果发现,没有经验的评估员给出的估计数平均相差70,000美元。 作为数据科学家的角色 房地产投资信托基金已决定采用数据驱动的方法来评估物业,而不是依靠评估师的个人专业知识。 目前,房地产投资信托基金有尚未开发的市场上先前物业交易价格
1
纽约出租车需求预测 预测纽约市未来10分钟内黄色出租车的出租车需求。 这款python笔记本将使用出租车和豪华轿车委员会提供的用于黄色出租车的数据来开发机器学习模型,以预测纽约黄色出租车的出租车需求。 基于这些数据,机器学习模型可以预测10分钟内出租车的取货需求。 在这个python笔记本中,已经训练了不同的机器学习模型,并测试了准确性。 资料总览 接送日期/时间 接送地点 旅行距离, 逐项列出的票价 费率类型 付款方式 驾驶员报告的乘客人数 首先使用给定的数据,我们将进行数据清理并将数据转换为所需的格式。 为了将纽约市划分为区域,以便可以进行区域虎钳的预测,我们将使用K-means算法。 功能重要性是任何机器学习问题的重要组成部分。 在这里,我们将通过一次生成具有比率和先前值的特征(t-1)来使用低于基线的模型,并计算平均绝对百分比误差。 移动平均线 加权移动平均线 指数移动
2021-08-21 11:52:43 3.4MB JupyterNotebook
1
作为全球金融中心,纽约市(NYC)的交通运输系统一直在各个方面进行研究。 自2009年以来,纽约市出租车和豪华轿车委员会已经公开了有关纽约市出租车运营的信息,为详细分析提供了机会。 因此,该研究项目基于大数据分析来调查纽约市的出租车运营。 本文讨论了出租车运营与不同类型的天气之间的相关性,包括降水,雪深和降雪。 该研究还使用Geopandas评估了每个NTA地区的出租车行程分布,并将其密度显示在NYC地图上。
2021-08-21 11:51:16 915KB 行业研究
1
纽约市Airbnb数据的回归分析 概述 对于这个项目,我决定使用Kaggle.com的NYC Airbnb数据集。 Airbnb是Airbnb的缩写,最初的名称是AirBedandBreakfast.com,如今它已成为一种被全世界使用和认可的服务。 对于各个年龄段的旅客,Airbnb都在变得越来越受欢迎。 家庭,商务专业人士和单身旅行者都开始使用Airbnb作为传统酒店客房的替代选择。 价格的灵活性,便利设施的选择以及遍布各地的位置使它们成为旅行者的理想选择。数以百万计的列表产生了大量数据,可以分析这些数据并用于业务决策,了解客户和提供商的行为以及绩效。平台。 目标 挑选房屋的想法似乎令人生畏,但是通过仔细的分析和数据,确定邻居价格的范围可以缩小,从而使决策变得更加容易。 该项目的目的是分析不同特征并建立ML模型以预测价格。 关于数据集 Datset是有关纽约市行政区中不同房东的Airb
2021-07-23 16:10:04 2.26MB R
1
纽约自行车骑士分析 在自治市镇级别和自行车站点位置上对纽约市事故进行分析。 数据源 •自行车站: : •车辆撞车: : 设置环境的步骤 •下载车辆撞车的csv文件,并将其放置在与其他文件相同的目录中。 •使用pip软件包管理器按照笔记本文件中的说明安装所有软件包。 •更新放置所有文件的项目的工作目录。 •运行笔记本文件。 迄今为止完成的工作包括 关于车辆碰撞和自行车站位置的探索性数据分析。 建立预测未来几年事故的模式。 任何意见/建议/问题都非常欢迎。 谢谢!
2021-06-30 21:08:40 4.19MB JupyterNotebook
1
纽约市-Airbnb-数据产品 纽约市Airbnb数据的数据分析,可视化和预测 描述 该项目分析了2019年从纽约市地区收集的Airbnb数据,该数据的列表范围从私人住宅到房间,邻里,邻里群体,价格等。该项目的目标是创建一个可以预测的模型未来的AirBnb价格以及城市中哪些街区最有利可图。 数据源 该公开数据集是Airbnb的一部分,其原始资源可在此上。 它包含定性和定量数据的混合,有48,895个条目和16列。 我们的模型将包括34,218个培训条目和14,666个测试目标标签PRICE的条目。 结果 模型 RSME平均值 RSME平均10倍 线性回归 0.495 0.498 随机森林回归 0.493 0.509 XgBoost 0.473 N 套索回归 0.693 0.698 模型 准确性 随机森林分类器 83.4% 逻辑回归 84.5% (整体最佳) 决策树 8
2021-06-29 10:48:00 2.51MB python data-science numpy pandas
1
预测一个车手的出租车费 sample_submission.csv test.csv
2021-06-23 10:21:16 258KB 数据集
1