worldwindjava源码-Analysis-of-Flight-Delay-and-Weather-Datasets:飞行延误和天气数据

上传者: 38714910 | 上传时间: 2022-02-05 10:19:05 | 文件大小: 2.7MB | 文件类型: -
世界风java源码使用 NoSQL 分析航班延误和天气数据集 介绍 该项目的目标是构建一个应用程序,该应用程序可以从两个不同的海量数据存储中摄取、存储、分析和提取有意义的见解。 这些来源中的第一个来源是 NOAA(国家海洋和大气管理局),它为我们提供了来自世界各地站点网络的每小时天气天气观测。 第二个数据源是 UBTS(美国运输服务局),它为我们提供了航班历史和延误情况。 技术栈 Python Java SQL Hadoop HBase 火花 阿帕奇凤凰 阿帕奇飞艇 Scikit-学习 熊猫 决定技术栈的标准 天气和飞行数据集的大小分别约为 750 GB 和 225 GB。 巨大的数据量促使我们构建一个可扩展的分布式 NoSQL 数据库,例如 HBASE 来存储数据 原始形式的数据集不利于分析,需要大量的预处理。 自定义python脚本用于预处理数据 后预处理,我们需要一个可扩展的分布式流程,可以批量上传到 HBase。 Apache Spark 非常适合这里,因为它具有独特的内存处理能力,可以以非常高的速度处理大规模数据 该应用程序必须使其用户易于访问。 由于当前世界上的大多数用户已

文件下载

评论信息

免责申明

【只为小站】的资源来自网友分享,仅供学习研究,请务必在下载后24小时内给予删除,不得用于其他任何用途,否则后果自负。基于互联网的特殊性,【只为小站】 无法对用户传输的作品、信息、内容的权属或合法性、合规性、真实性、科学性、完整权、有效性等进行实质审查;无论 【只为小站】 经营者是否已进行审查,用户均应自行承担因其传输的作品、信息、内容而可能或已经产生的侵权或权属纠纷等法律责任。
本站所有资源不代表本站的观点或立场,基于网友分享,根据中国法律《信息网络传播权保护条例》第二十二条之规定,若资源存在侵权或相关问题请联系本站客服人员,zhiweidada#qq.com,请把#换成@,本站将给予最大的支持与配合,做到及时反馈和处理。关于更多版权及免责申明参见 版权及免责申明