上传者: 42100032
|
上传时间: 2021-12-15 21:09:39
|
文件大小: 1.83MB
|
文件类型: -
纽约市出租车数据分析
在这个最后的小组项目中,我们以“理解出租车经济学”为主题分析纽约出租车数据,它是在 Map-Reduce 算法中使用 Hadoop Streamming API 和 Python 实现的。
调查的问题
不同社区的收入有何不同,它与社区的家庭收入中位数有何关联?
收入如何随时间变化? 出租车公司赚更多(或更少)钱的月份还是季节?
出租车司机在没有乘客的情况下可以行驶多久? 这如何随时间变化?
重大活动期间收入会受到影响吗? 例如,游行、总统访问、风暴
数据源
2013年出租车数据行程数据: : 票价数据: :
人口普查数据人口统计: : 收入信息: : 人口普查区域的形状文件: : (搜索“tract”)
天气数据 -- 选择“Surface Data, Hourly Global”,然后在选择地区的时候,选择NY和三个主站(Centra