世界风java源码使用 NoSQL 分析航班延误和天气数据集 介绍 该项目的目标是构建一个应用程序,该应用程序可以从两个不同的海量数据存储中摄取、存储、分析和提取有意义的见解。 这些来源中的第一个来源是 NOAA(国家海洋和大气管理局),它为我们提供了来自世界各地站点网络的每小时天气天气观测。 第二个数据源是 UBTS(美国运输服务局),它为我们提供了航班历史和延误情况。 技术栈 Python Java SQL Hadoop HBase 火花 阿帕奇凤凰 阿帕奇飞艇 Scikit-学习 熊猫 决定技术栈的标准 天气和飞行数据集的大小分别约为 750 GB 和 225 GB。 巨大的数据量促使我们构建一个可扩展的分布式 NoSQL 数据库,例如 HBASE 来存储数据 原始形式的数据集不利于分析,需要大量的预处理。 自定义python脚本用于预处理数据 后预处理,我们需要一个可扩展的分布式流程,可以批量上传到 HBase。 Apache Spark 非常适合这里,因为它具有独特的内存处理能力,可以以非常高的速度处理大规模数据 该应用程序必须使其用户易于访问。 由于当前世界上的大多数用户已
2022-02-05 10:19:05 2.7MB 系统开源
1
#转到RAW以获得更好的视图 机器学习项目 伦敦希思罗机场预测的航班延误为了对机器进行培训,您需要使用FlightRadar24_scrapper构建数据集(至少2-3周的数据)。 数据准备工作是在抓取器中执行的,但是数据清理和功能工程则在机器学习文件中进行。 爬虫可能有重复的值,这些值已在机器学习脚本中删除。 示例数据集包含在用于训练模型和验证模型的存储库中。 用于刮板的版本: jupyter核心:4.6.3 jupyter笔记本:6.1.1 qtconsole:4.7.7 ipython的:7.18.1 ipykernel:5.3.4 jupyter客户:6.1.6 jupyter实验室:2.2.6 nbconvert:6.0.6 ipywidgets:7.5.1 nbformat:5.0.7 特质:4.3.3 的Python:3.8.5 熊猫:1.1.1
2022-01-27 12:04:36 2.13MB JupyterNotebook
1
机器学习老师推荐的论文,是关于民航的。基于使用现有的支持向量机解决机场航班延误预警问题存在未充分利用先验知识和 训练需花费大量时间和空间的问题,提出了基于中心约束最小闭包球的加权多类算法。该算 法首先利用先验知识确定一种新的基于相对紧密度的方法计算样本权值并将其融合到支持向 量机中,然后转化为中心约束的最小闭包球进行训练。实验结果表明,该方法比现有的支持向 量机具有更合理的分类面并且训练速度得到大大提高。
2022-01-09 13:11:19 402KB 航班延误
1
目录 安装 除了Python的Anaconda发行版之外,没有任何必要的库可以在此处运行代码。 使用Python版本3. *,该代码应该可以正常运行。 项目动机 该项目的目标是练习创建数据可视化。 为此,创建了探索性可视化以帮助提出问题。 选择了这些可视化的一部分,并将其精炼成说明性的可视化,以幻灯片形式显示。 该项目的数据集包括整个2019年的近750万次国内航班。它包括航班详细信息,例如出发/到达时间,始发/目的地机场,承运人和延误时间/取消。 该项目包括对到达延误和取消的分析,但调查的重点是仅取消航班的特征。 我看以下内容: 到达延迟时间的分布以及延迟和取消的分类分布 取消原因的分布 取消原因与季节 取消原因与机场的季节对比 档案说明 存储库中有两个Jupyter笔记本。 Exploration_flights.ipynb在创建可视化对象以摆出并回答上述问题方面具有探索性。 s
2021-12-18 15:30:06 209.66MB HTML
1
飞机延迟 使用机器学习模型预测航班延误 在这个存储库中,我开发了一个模型,旨在预测起飞时的航班延误。 从技术角度来看,贯穿整个 notebook 的 Python 的主要方面是: visualization: matplolib, seaborn, basemap data manipulation: pandas, numpy modeling: sklearn, scipy class definition: regression, figures 打扫 1.1日期和时间 1.2 填充因子 比较航空公司 2.1 航空公司基本统计说明 2.2 延误分布:建立航空公司排名 延误:起飞或降落 始发机场与延误的关系 4.1 航空公司覆盖的地理区域 4.2 始发机场如何影响延误 4.3通常延误的航班 延误的时间可变性 预测航班延误 6.1 模式一:一航一机场 6.1.1 Pitfalls
1
为了更加真实准确地反映道路网络的交通流状态,该文综合考虑拥挤交通网络的特点,建立了带转向延误和通行能力限制的交通网络配流模型,模型中路段和转向通行能力约束条件的Lagrange乘子等于因交通拥堵而产生的排队延误。该文采用动态罚函数算法,将原问题转化为一系列不带通行能力限制的传统交通分配问题进行求解,随后以 Nguyen Dupuis网络为算例进行测试。计算结果表明:当流量达到通行能力时,排队延误就会产生,平衡流量满足 Wardrop均衡准则。该模型能够很好地反映拥挤交通网络流量特点,提出的算法也具有很好的
2021-11-23 20:36:50 1.21MB 自然科学 论文
1
中国枢纽机场航班延误预测建模-以上海浦东国际机场为例
2021-11-23 17:29:50 128KB 研究论文
1
美国运输部(DOT)交通运输统计局(BTS)对美国大型航空公司国内航班的准时到达和晚点情况进行的统计数据,时间开始于2003年6月,每个月美国交通运输统计司会发布上个月的航班准点到达、晚点、取消和转机情况数据。
2021-11-11 21:22:12 65.9MB 数据集
1
为了改善城市道路交叉口交通信号控制,降低交叉口车辆延误,提出了一种基于改进遗传算法优化的模糊控制方法。在优化模糊控制器的过程中,为避免出现“早熟”现象,采用改进的自适应遗传算法,在进化过程中动态调整种群中适应度值最大个体的交叉概率和变异概率,使种群进化不会处于一种近似停滞不前的状态。为了检验该控制方法的性能,以交叉口车辆平均延误作为性能评价指标,在相同交通条件下进行了仿真实验。结果表明,相对于普通模糊控制器,经过改进遗传算法优化的模糊控制器能有效减小交叉口车辆的平均延误,提高交叉口的通行能力。
1
关于航班的调度,对模型求解的思路是:把所有处于最早延误航班之后到达或停驻该枢纽机场的飞机、备用飞机和当天可以恢复使用的飞机都作为调度对象,将这些飞机重新指派给航班,使延误成本最低或延误时间最短,
2021-10-14 17:03:52 3KB 机场延误
1