此数据集包括名称,出生年份,性别和婴儿的母亲种族的列。它还包括一个等级列(该名称相对于列表中其余名称的流行度)。 Most_Popular_Baby_Names_by_Sex_and_Mother_s_Ethnic_Group__New_York_City.csv
2023-04-23 14:24:59 137KB 数据集
1
纽约市开放数据 - GeoJSON 格式 作为今年项目的一部分,我们采用了计划提供的一些并将其绘制在地图上。 您可能认为这只需几秒钟,但不幸的是,无法以提取数据,因此无法轻松绘制在诸如地图上。 因此,为了让其他人的生活更轻松,这个存储库包含了一些数据集的已转换的 GeoJSON 数据。 它们已根据类别分类到不同的目录中,自述文件中提供了有关每个数据集的信息。 检查上次更新日期的最新提交信息。 想要添加一个新的 GeoJSON 文件吗? 更新了现有的? 当添加或更新新数据集时,此存储库不会自动更新,因此它很可能仅存储历史数据。 如果您有一个新的 GeoJSON 文件,请随时更新 category 目录中的 README(如果需要,创建一个新的),添加 GeoJSON 文件,并在 GitHub 上创建一个到此存储库的拉取请求。
2022-11-04 23:12:20 1.87MB
1
nyc-taxi-demo 使用Elasticsearch和机器学习的NYC出租车演示 下载出租车数据 转到并下载2016年10月至12月(黄色出租车)的CSV文件。 为了简化操作,请使用脚本download_raw_data.sh下载这些月份(还取决于您是否具有本地raw_data_urls.txt ) 使用Logstash导入Elasticsearch 在输出部分更改taxi.conf文件中的用户名和密码 每个月使用taxi.conf配置文件运行Logstash-例如: tail -n +2 /path/to/data/yellow_tripdata_2016-10.csv | /path/to/logstash-6.3.1/bin/logstash -f /path/to/taxi.conf 转到Kibana,在“管理”下创建一个名为“ nyc-taxi- *”的索引模式 导入
2022-06-27 12:09:50 11KB Shell
1
颜色分类leetcode # 回购内容 子目录中的 .md 格式 /NYC Green Taxi/NYC Green Taxi.md 纽约市绿色出租车 ipython 笔记本 用于可视化。 试试我的 运行预测的脚本 我的分类器模型的泡菜 我的回归模型的泡菜 如何使用 tip_predictor.py 进行预测的笔记本示例 A 对 2015 年 9 月数据集的预测。 这有两列。 第一个是交易指数,第二个是预测百分比提示 注意:这整个也可以在我的 bitbucket 上找到 import pandas as pd import numpy as np import datetime as dt import matplotlib . pyplot as plt import os , json , requests , pickle from scipy . stats import skew from shapely . geometry import Point , Polygon , MultiPoint , MultiPolygon from scipy . stats impor
2022-06-12 00:13:21 18.85MB 系统开源
1
Nyc-Taxi-Kaggle-挑战 目标 Kaggle竞赛预测纽约出租车的行驶时间。 该项目的报告在capstone.pdf。 (在这个项目中,我提供了许多链接,如果您是初学者,可以通过这些链接来弄清楚您的概念,如果不理解的话,可以通过project和readme中提供的链接和pdf来了解。) 问题陈述 在本报告中,我们使用来自纽约市出租车和高级轿车委员会的数据来考察Kaggle竞赛,该竞赛要求竞争对手预测纽约市出租车旅行的总行驶时间(trip_duration)。 Kaggle提供的数据是作为CSV文件提供的结构化数据。 CSV文件中的数据包括多种格式:时间戳,文本和数字数据。 这是回归分析,因为输出(总行驶时间)是数字。 我将使用几种机器学习方法来完成预测任务,这些方法是线性回归,k最近邻回归,随机森林和XGBoost。 将使用均方根对数误差对模型进行评估。 总览 我使用Jupyter_Notebook在dekstop上执行此项目,并且在使用python的远程服务器上也无需使用Jupyter_notebook来执行。 软件和库 Python 3 Scikit-learn:Pyt
2022-06-05 16:04:07 23.28MB python machine-learning deep-learning random-forest
1
纽约犯罪数据 我们的数据可视化计算服务项目-纽约犯罪数据地图。 我们使用了2015-2020年的NYPD投诉数据。 我们从找到的文件中解析了数据。 我们使用了在上找到的教程来指导我们的过程。 免责声明 我们使用的数据来自纽约和纽约市政府。 我们按地区划分的投诉数据被标记为“有效”数据。 没有给出有关使投诉有效或无效的解释,因此在检查我们的可视化文件时请格外小心。 用法 在浏览器中打开test.html以查看我们的可视化 数据 去做 整理数据-我们到底拥有什么? 弄清楚如何绘制区域 贫困线以下人口的地图(人均?) 人均总暴力犯罪地图
2022-06-03 19:43:29 15.2MB HTML
1
考试系统毕业设计项目含源码项目:分析纽约市高中数据 美国教育体系中最具争议的问题之一是标准化考试的有效性,以及它们是否对某些群体不公平。 鉴于我们对这个主题的先验知识,调查 SAT 分数和人口统计数据之间的相关性可能是一个有趣的角度。 我们可以将 SAT 分数与种族、性别、收入等因素相关联。 SAT 或 Scholastic Aptitude Test,是美国高中生在申请大学之前参加的一项考试。 大学在决定录取谁时会考虑考试成绩,因此在考试成绩上表现出色是相当重要的。 测试由三个部分组成,每个部分有 800 个可能的分数。 总分超过 2,400 分(虽然这个数字已经改变了几次,但我们项目的数据集基于 2,400 总分)。 组织通常根据平均 SAT 分数对高中进行排名。 分数也被视为衡量整体学区质量的指标。 纽约市在网上提供,以及 . SAT 数据的前几行如下所示: 不幸的是,结合这两个数据集不会为我们提供我们想要使用的所有人口统计信息。 我们需要用其他来源补充我们的数据以进行全面分析。 同一个网站有几个相关的数据集,涵盖人口统计信息和考试成绩。 以下是我们将使用的所有数据集的链接: 按
2022-05-26 11:24:47 4.67MB 系统开源
1
考试系统毕业设计项目含源码出于本项目的目的,我们将使用有关纽约市公立学校的数据。 介绍: 美国教育体系中最具争议的问题之一是标准化考试的有效性,以及它们是否对某些群体不公平。 SAT 或 Scholastic Aptitude Test,是美国高中生在申请大学之前参加的一项考试。 大学在决定录取谁时会考虑考试成绩,因此在考试成绩上表现出色是相当重要的。 测试由三个部分组成,每个部分有 800 个可能的分数。 总分超过 2,400 分(虽然这个数字已经改变了几次,但我们项目的数据集基于 2,400 总分)。 组织通常根据平均 SAT 分数对高中进行排名。 分数也被视为衡量整体学区质量的指标。 我们需要用其他来源补充我们的数据以进行全面分析。 同一个网站有几个相关的数据集,涵盖人口统计信息和考试成绩。 以下是我们将使用的所有数据集的链接: 按学校划分的 SAT 分数 - 纽约市每所高中的 SAT 分数 学校出勤 - 纽约市每所学校的出勤信息 班级规模 - 每所学校班级规模的信息 AP 考试成绩 - 每所高中的大学预修 (AP) 考试成绩(通过特定科目的可选 AP 考试可以获得该科目的学生大
2022-05-16 16:19:27 4.72MB 系统开源
1
NYC_CitiBike_2019--Python数据_可视化
2022-03-17 21:55:59 95.5MB JupyterNotebook
1
纽约黄色出租车
2022-01-13 01:32:31 3.1MB R
1