预测航空公司延误 使用Hadoop通过2007年和2008年的数据预测奥黑尔机场的航班延误。使用Pig脚本,构建了一个特征矩阵,通过该矩阵我们可以训练和预测航空公司的延误,准确度约为80% 项目详情 建立了一个预测航空公司延误的模型,准确度约为80% 将航空公司数据集与UCI Repo的740万飞行记录一起使用 利用Pydoop实现MapReduce以构建特征矩阵 使用Pig脚本生成功能 使用Python,Scikit-Learn,Pig,Hadoop,HDFS,AWS EMR,IPython构建 技术指标 Python 2.7 Hadoop 2.7.3 Scikit学习 大熊猫 线性回
2022-12-29 17:10:00 6KB python hadoop random-forest scikit-learn
1
飞行延迟预测 介绍 延误是任何运输系统中最令人难忘的性能指标之一。 值得注意的是,民航业者将延误理解为航班延误或推迟的时间。 因此,延迟可以由飞机的起飞或到达的预定时间与实际时间之间的差异来表示。 国家监管机构有许多与航班延误的容忍阈值有关的指标。 实际上,航班延误是航空运输系统中必不可少的主题。 2013年,欧洲有36%的航班延误了超过5分钟,而美国有31.1%的航班延误了超过15分钟。 这表明该指标的相关性如何,以及无论航空公司网格的规模如何对其产生影响。 为了更好地了解整个飞行生态系统,每时每刻都会收集来自商业航空的大量数据并将其存储在数据库中。 淹没在传感器和物联网产生的大量数据中,分析人员和数据科学家正在增强其计算和数据管理技能,以从每个数据中提取有用的信息。 在这种情况下,理解领域,管理数据和应用模型的过程被称为数据科学,这是解决与大数据有关的挑战性问题的趋势。 在此项目中,我
1
美国交通运输部统计司公布的2015年国内民航航班数据,包括航班准点、延误、取消、转机和摘要等信息。
2022-05-14 14:47:55 192.33MB 航班取消 航班延误
1
Predicting_Flight_Delays 该项目旨在通过培训2018年和2019年美国的航班数据来提前一周预测航班延误
2022-04-05 06:41:14 613KB JupyterNotebook
1
美国交通运输部统计司公布的2015年国内民航航班数据,包括航班准点、延误、取消、转机和摘要等信息。
2022-04-03 19:11:57 192.33MB 航班取消 航班延误
1
美国运输部(DOT)交通运输统计局(BTS)对美国大型航空公司国内航班的准时到达和晚点情况进行的统计数据,时间开始于2003年6月,每个月美国交通运输统计司会发布上个月的航班准点到达、晚点、取消和转机情况数据。
2022-04-01 20:29:55 65.9MB 数据集
1
#转到RAW以获得更好的视图 机器学习项目 伦敦希思罗机场预测的航班延误为了对机器进行培训,您需要使用FlightRadar24_scrapper构建数据集(至少2-3周的数据)。 数据准备工作是在抓取器中执行的,但是数据清理和功能工程则在机器学习文件中进行。 爬虫可能有重复的值,这些值已在机器学习脚本中删除。 示例数据集包含在用于训练模型和验证模型的存储库中。 用于刮板的版本: jupyter核心:4.6.3 jupyter笔记本:6.1.1 qtconsole:4.7.7 ipython的:7.18.1 ipykernel:5.3.4 jupyter客户:6.1.6 jupyter实验室:2.2.6 nbconvert:6.0.6 ipywidgets:7.5.1 nbformat:5.0.7 特质:4.3.3 的Python:3.8.5 熊猫:1.1.1
2022-01-27 12:04:36 2.13MB JupyterNotebook
1
机器学习老师推荐的论文,是关于民航的。基于使用现有的支持向量机解决机场航班延误预警问题存在未充分利用先验知识和 训练需花费大量时间和空间的问题,提出了基于中心约束最小闭包球的加权多类算法。该算 法首先利用先验知识确定一种新的基于相对紧密度的方法计算样本权值并将其融合到支持向 量机中,然后转化为中心约束的最小闭包球进行训练。实验结果表明,该方法比现有的支持向 量机具有更合理的分类面并且训练速度得到大大提高。
2022-01-09 13:11:19 402KB 航班延误
1
目录 安装 除了Python的Anaconda发行版之外,没有任何必要的库可以在此处运行代码。 使用Python版本3. *,该代码应该可以正常运行。 项目动机 该项目的目标是练习创建数据可视化。 为此,创建了探索性可视化以帮助提出问题。 选择了这些可视化的一部分,并将其精炼成说明性的可视化,以幻灯片形式显示。 该项目的数据集包括整个2019年的近750万次国内航班。它包括航班详细信息,例如出发/到达时间,始发/目的地机场,承运人和延误时间/取消。 该项目包括对到达延误和取消的分析,但调查的重点是仅取消航班的特征。 我看以下内容: 到达延迟时间的分布以及延迟和取消的分类分布 取消原因的分布 取消原因与季节 取消原因与机场的季节对比 档案说明 存储库中有两个Jupyter笔记本。 Exploration_flights.ipynb在创建可视化对象以摆出并回答上述问题方面具有探索性。 s
2021-12-18 15:30:06 209.66MB HTML
1