此数据集包括名称,出生年份,性别和婴儿的母亲种族的列。它还包括一个等级列(该名称相对于列表中其余名称的流行度)。 Most_Popular_Baby_Names_by_Sex_and_Mother_s_Ethnic_Group__New_York_City.csv
2023-04-23 14:24:59 137KB 数据集
1
纽约市餐厅检查中识别和分析模式 一个检查纽约市五个行政区的餐馆健康检查结果数据集的项目。 我生成了各种数据的EDA可视化,并进行了统计假设检验,将餐馆等级与当地社区的财富联系起来。 我还使用Python中的地理绘图库来创建数据的色谱和热图。 数据源 纽约市卫生局提供的有关该市所有餐厅的每个健康检查结果的官方数据集。 Python包uszipcode用于收集纽约市中位数收入数据 背景资料 2019年,纽约的餐饮业包括24,000家餐厅和317,000个工作岗位-这两个数字均创历史新高。 此外,在过去十年中,餐饮业的增长率是整个城市企业增长率的两倍。 2020年的大流行以及其他许多方面极大地改变了纽约市餐饮业的规模。 该项目将仅查看完整的2017-2019日历年中的数据。 卫生部定期对这些场所中的每个场所进行健康检查,并为发现的每种卫生违规行为提供一定的分数: “ A”级:0-13分
2023-03-08 13:07:48 3.54MB JupyterNotebook
1
纽约市开放数据 - GeoJSON 格式 作为今年项目的一部分,我们采用了计划提供的一些并将其绘制在地图上。 您可能认为这只需几秒钟,但不幸的是,无法以提取数据,因此无法轻松绘制在诸如地图上。 因此,为了让其他人的生活更轻松,这个存储库包含了一些数据集的已转换的 GeoJSON 数据。 它们已根据类别分类到不同的目录中,自述文件中提供了有关每个数据集的信息。 检查上次更新日期的最新提交信息。 想要添加一个新的 GeoJSON 文件吗? 更新了现有的? 当添加或更新新数据集时,此存储库不会自动更新,因此它很可能仅存储历史数据。 如果您有一个新的 GeoJSON 文件,请随时更新 category 目录中的 README(如果需要,创建一个新的),添加 GeoJSON 文件,并在 GitHub 上创建一个到此存储库的拉取请求。
2022-11-04 23:12:20 1.87MB
1
颜色分类leetcode # 回购内容 子目录中的 .md 格式 /NYC Green Taxi/NYC Green Taxi.md 纽约市绿色出租车 ipython 笔记本 用于可视化。 试试我的 运行预测的脚本 我的分类器模型的泡菜 我的回归模型的泡菜 如何使用 tip_predictor.py 进行预测的笔记本示例 A 对 2015 年 9 月数据集的预测。 这有两列。 第一个是交易指数,第二个是预测百分比提示 注意:这整个也可以在我的 bitbucket 上找到 import pandas as pd import numpy as np import datetime as dt import matplotlib . pyplot as plt import os , json , requests , pickle from scipy . stats import skew from shapely . geometry import Point , Polygon , MultiPoint , MultiPolygon from scipy . stats impor
2022-06-12 00:13:21 18.85MB 系统开源
1
考试系统毕业设计项目含源码项目:分析纽约市高中数据 美国教育体系中最具争议的问题之一是标准化考试的有效性,以及它们是否对某些群体不公平。 鉴于我们对这个主题的先验知识,调查 SAT 分数和人口统计数据之间的相关性可能是一个有趣的角度。 我们可以将 SAT 分数与种族、性别、收入等因素相关联。 SAT 或 Scholastic Aptitude Test,是美国高中生在申请大学之前参加的一项考试。 大学在决定录取谁时会考虑考试成绩,因此在考试成绩上表现出色是相当重要的。 测试由三个部分组成,每个部分有 800 个可能的分数。 总分超过 2,400 分(虽然这个数字已经改变了几次,但我们项目的数据集基于 2,400 总分)。 组织通常根据平均 SAT 分数对高中进行排名。 分数也被视为衡量整体学区质量的指标。 纽约市在网上提供,以及 . SAT 数据的前几行如下所示: 不幸的是,结合这两个数据集不会为我们提供我们想要使用的所有人口统计信息。 我们需要用其他来源补充我们的数据以进行全面分析。 同一个网站有几个相关的数据集,涵盖人口统计信息和考试成绩。 以下是我们将使用的所有数据集的链接: 按
2022-05-26 11:24:47 4.67MB 系统开源
1
PLUTO是纽约市建筑物位置和特征的主要记录。它由纽约市城市规划局大约每季度到每半年发布一次,并且是纽约市最重要的公民分析数据集之一。PLUTO包含有关建筑物高度,平方英尺,位置,类型,地标状态,单元数,所有者,施工年份以及其他相关领域的信息。 BK.csv BX.csv MN.csv PLUTODD16v2.pdf Plutolay16v2.pdf PlutoReadme16v2.pdf QN.csv SI.csv
2022-03-28 15:37:39 46.72MB 数据集
1
噪音 3D Web地图比2D Web地图在数据可视化方面具有更多的多功能性。 如果此实验室的数据集以2D可视化,则这些点的顺序颜色编码将仅显示按某个值范围将哪些点分组在一起,而不是可视化每个点的特定值。 通过3D映射,仍然保留了颜色编码,但观看者还可以看到每个点值的各个大小。 因此,在尝试传达除空间分布之外的单个数据值的大小时,3D映射比2D Web映射更合适。 3D Web地图比2D Web地图更合适的另一种情况是制图高程。 人眼可能难以从上方解释高程,这就是为什么2D地图经常尝试使用等高线或渐变来表示高程的原因。 借助3D地图,观看者可以更好地理解海拔高度,因为数据以更相关的方式可视化,类似于传统的地面观察人类体验。 这在(来源:南卡罗来纳州自然资源部)。 从上面看,很难完全了解海拔差异。 从3D侧面看时,丘陵和山谷变得更加清晰。
2022-03-27 10:56:31 4.1MB HTML
1
纽约市出租车数据分析 在这个最后的小组项目中,我们以“理解出租车经济学”为主题分析纽约出租车数据,它是在 Map-Reduce 算法中使用 Hadoop Streamming API 和 Python 实现的。 调查的问题 不同社区的收入有何不同,它与社区的家庭收入中位数有何关联? 收入如何随时间变化? 出租车公司赚更多(或更少)钱的月份还是季节? 出租车司机在没有乘客的情况下可以行驶多久? 这如何随时间变化? 重大活动期间收入会受到影响吗? 例如,游行、总统访问、风暴 数据源 2013年出租车数据行程数据: : 票价数据: : 人口普查数据人口统计: : 收入信息: : 人口普查区域的形状文件: : (搜索“tract”) 天气数据 -- 选择“Surface Data, Hourly Global”,然后在选择地区的时候,选择NY和三个主站(Centra
2021-12-15 21:09:39 1.83MB HTML
1
出租车票价预测 预测纽约市出租车的票价
2021-12-15 20:25:16 2KB
1
数据包含Uber在美国纽约市的乘车记录,分为两段:2014年4月到9月之间,约450万项;2015年1月到6月间1430万项。另外包括10家租车公司行车级别的数据,和329家租车公司汇总级的数据。
2021-12-08 20:59:26 114.76MB Uber 优步 Kaggle 共享经济
1