NYC_NY8 软件安装包,版本1.30,安装简单,直接根据提示安装,以及注意事项,希望对各位有帮助
2022-01-11 19:56:11 1013KB 九齐 NYC_NY8 v1.30
1
如何使用AWS EC2 Hadoop集群处理200 GB数据 存储200 GB的NYC出租车数据集并部署Cloudera Hadoop集群以对其进行可视化。 使用Python Datashader绘制和可视化Hadoop大型数据集 没有Datashader的可视化 工作流程概述 使用数据着色器 最终可视化
2021-12-23 11:05:42 1.68MB jupyter-notebook pyspark dask datashader
1
ny8 c 编译器
2021-12-06 13:02:42 1.11MB nyc_ny8
1
matlab二维光栅代码纽约市出租车需求预测 2017 年 4 月 29 日更新:新数据(demand.h5、holiday.txt、...)上传到 2017-04-12 更新:天气数据 (Meteorology.h5) 上传到 这在 onedrive 上不断更新。 2017-03-21 更新:HDF5 和假日数据上传到 原始数据来源 天气: 。 批量订单可通过 纽约出租车: 生成的数据是使用 2 年的原始黄色出租车数据(从 2014-07-01 到 2016-06-30)得出的。 目前,我们仅使用了 6 个月的原始数据,总大小为 10 GB . 数据生成过程(在 Mapreduce 工作流中设计和实现)需要 2.5 小时(用于处理两年的数据)。 这个过程可以使用相同的代码在集群上完成(需要联系 Columbia HPC)。 Demand.mat : 以 Matlab 二进制文件格式存储的生成数据。 它包含两个变量:时间表“需求”和地理参考对象“R”。 R:提供地理信息(例如地理范围)的地理参考对象 R= Latitude Limits: [40.6769, 40.8868] Long
2021-10-29 19:55:46 3.51MB 系统开源
1
NYC_Traffic_Safety_Project 我整理并整理了我所做的第一个项目的代码(与同学们组成一个团队,归功于陈书效,赖小亚,罗旭丹,钟敏喜和李嘉颖)。 此仓库包含纽约市地图和事故的原始数据,还包括用于进行预处理并将其输入到CNN模型中的Python代码。 背景 在城市中,交通事故正成为越来越普遍的伤害和死亡原因。 根据NYC Open Data的数据,仅在纽约,2018年过去几天每天平均发生622起交通事故。 因此,预测未来事故的能力(例如,地点,时间或方式)不仅对公共安全利益相关者(例如,警察,自治企业)而且对运输管理人员和个人旅行者都非常有用。 许多学者对交通事故的原因进行了大量研究,但很少关注道路设计。 但是,在许多情况下,每年都会设计出令人难以置信的十字路口,导致事故发生。 我们做了什么 我们训练了一个卷积神经网络(CNN),使用十字路口的卫星图像作为特征,附近交通
2021-10-02 14:33:35 16.21MB Python
1
纽约市财产回归 基于纽约数据的房地产价格预测的真实案例研究。 项目背景 以在纽约州投资于房屋和公寓的房地产投资信托(REIT)为例,房地产投资信托(REIT)业务的一部分是试图预测房地产在出售前的公平交易价格。 他们这样做是为了校准内部定价模型并保持市场脉动。 在此项目中,数据集表示纽约州一个小县内房屋,公寓和公寓的投资。 当前的工作解决方案 房地产投资信托目前使用第三方评估服务,以其自身的专业知识估算房地产价格。 在实践中,各个评估员的技能水平差异很大。 为了估算错误定价范围,房地产投资信托基金进行了试运行,以将实际交易价格与评估师的估算值进行比较。 结果发现,没有经验的评估员给出的估计数平均相差70,000美元。 作为数据科学家的角色 房地产投资信托基金已决定采用数据驱动的方法来评估物业,而不是依靠评估师的个人专业知识。 目前,房地产投资信托基金有尚未开发的市场上先前物业交易价格
1
纽约出租车需求预测 预测纽约市未来10分钟内黄色出租车的出租车需求。 这款python笔记本将使用出租车和豪华轿车委员会提供的用于黄色出租车的数据来开发机器学习模型,以预测纽约黄色出租车的出租车需求。 基于这些数据,机器学习模型可以预测10分钟内出租车的取货需求。 在这个python笔记本中,已经训练了不同的机器学习模型,并测试了准确性。 资料总览 接送日期/时间 接送地点 旅行距离, 逐项列出的票价 费率类型 付款方式 驾驶员报告的乘客人数 首先使用给定的数据,我们将进行数据清理并将数据转换为所需的格式。 为了将纽约市划分为区域,以便可以进行区域虎钳的预测,我们将使用K-means算法。 功能重要性是任何机器学习问题的重要组成部分。 在这里,我们将通过一次生成具有比率和先前值的特征(t-1)来使用低于基线的模型,并计算平均绝对百分比误差。 移动平均线 加权移动平均线 指数移动
2021-08-21 11:52:43 3.4MB JupyterNotebook
1
airbnb-nyc回归分析 在此存储库中,我分析了纽约市的airbnb列表,并使用了一个简单的线性回归模型来预测租金。 您可以检出kaggle链接,以防笔记本文件无法在GitHub上加载。
2021-07-23 16:49:39 6.03MB JupyterNotebook
1
纽约市Airbnb数据的回归分析 概述 对于这个项目,我决定使用Kaggle.com的NYC Airbnb数据集。 Airbnb是Airbnb的缩写,最初的名称是AirBedandBreakfast.com,如今它已成为一种被全世界使用和认可的服务。 对于各个年龄段的旅客,Airbnb都在变得越来越受欢迎。 家庭,商务专业人士和单身旅行者都开始使用Airbnb作为传统酒店客房的替代选择。 价格的灵活性,便利设施的选择以及遍布各地的位置使它们成为旅行者的理想选择。数以百万计的列表产生了大量数据,可以分析这些数据并用于业务决策,了解客户和提供商的行为以及绩效。平台。 目标 挑选房屋的想法似乎令人生畏,但是通过仔细的分析和数据,确定邻居价格的范围可以缩小,从而使决策变得更加容易。 该项目的目的是分析不同特征并建立ML模型以预测价格。 关于数据集 Datset是有关纽约市行政区中不同房东的Airb
2021-07-23 16:10:04 2.26MB R
1
纽约市Airbnb开放数据-实践 内容来源:Aurelien Geron(O'Reilly)的Scikit-Learn,Keras和TensorFlow的动手机器学习,第二版。 版权所有2019 Kiwisoft SAS,978-1-492-03264-9 机器学习实践。 在O'REILLY的动手机器学习的第2章项目之后实现该项目。 目标:根据所有其他指标,预测Airbnb帖子的单价。 预测纽约市Airbnb的租金方法: 监督学习任务,因为给定了带标签的转换示例(每个示例都带有预期的输出,即单位价格)。 回归任务,因为我们需要预测值。 多重回归问题,因为系统将使用多个特征进行预测。 单变量回归问题,因为我们仅尝试预测每个单位的单个值。 没有连续的数据流,不需要适应变化的数据,并且数据足够小以适合存储:批量学习 可能的性能指标:均方根误差(RMSE)和绝对绝对误差(MAE)。
2021-07-23 14:34:44 1.13MB JupyterNotebook
1