世界风java源码使用 NoSQL 分析航班延误和天气数据集 团队存储勇士 阿比奈·阿格拉瓦尔 安布吉纳扬 尼提哈拉卡蒂 拉胡尔·夏尔马 介绍 该项目的目标是构建一个应用程序,该应用程序可以从两个不同的海量数据存储中摄取、存储、分析和提取有意义的见解。 这些来源中的第一个来源是 NOAA(国家海洋和大气管理局),它为我们提供了来自世界各地站点网络的每小时天气天气观测。 第二个数据源是 UBTS(美国运输服务局),它为我们提供了航班历史和延误情况。 技术栈 Python Java SQL Hadoop HBase 火花 阿帕奇凤凰 阿帕奇飞艇 Scikit-学习 熊猫 决定技术栈的标准 天气和飞行数据集的大小分别约为 750 GB 和 225 GB。 巨大的数据量促使我们构建一个可扩展的分布式 NoSQL 数据库,例如 HBASE 来存储数据 原始形式的数据集不利于分析,需要大量的预处理。 自定义python脚本用于预处理数据 后预处理,我们需要一个可扩展的分布式流程,可以批量上传到 HBase。 Apache Spark 非常适合这里,因为它具有独特的内存处理能力,可以以非常高的速度处
2025-03-16 14:07:58 2.7MB 系统开源
1
Matlab研究室上传的视频均有对应的完整代码,皆可运行,亲测可用,适合小白; 1、代码压缩包内容 主函数:main.m; 调用函数:其他m文件;无需运行 运行结果效果图; 2、代码运行版本 Matlab 2019b;若运行有误,根据提示修改;若不会,私信博主; 3、运行操作步骤 步骤一:将所有文件放到Matlab的当前文件夹中; 步骤二:双击打开main.m文件; 步骤三:点击运行,等程序运行完得到结果; 4、仿真咨询 如需其他服务,可私信博主或扫描视频QQ名片; 4.1 博客或资源的完整代码提供 4.2 期刊或参考文献复现 4.3 Matlab程序定制 4.4 科研合作
2024-08-11 09:58:48 2.78MB matlab
1
信号交叉路口有时涉及多级人行横道,其中行人横穿一个或多个岛屿,然后在那儿等待信号继续。 如果对信号进行定时而不注意行人的前进,则多级交叉口的行人延误可能会很长。 本文讨论了两个问题。 首先,很少评估多级交叉路口的行人延误,因为除了微观模拟外,业内没有其他工具可实现这一目的。 我们提出了一种数值方法,用于确定任何阶段数和每个周期可能存在多个WALK间隔的交叉延迟。 可以将相同的方法应用于单级交叉口,对角线两级交叉口(行人可以选择路径)和自行车两级转弯。 此方法已在免费的在线工具中实现。 其次,我们描述了几种信号定时技术,可通过多级交叉路口改善行人和自行车骑行者的行进速度,从而减少行人和骑行者的延迟。 其中包括为选定的交叉路口提供服务,左转弯重叠,行人相相互重叠以及双向自行车交叉路口,这些交叉路口为两阶段转弯创建了路径选项。 实例表明,行人延误有可能大大减少,而行车延误通常很少增加或没有增加。 在一个示例中,增加短的行人重叠阶段使三级交叉口的平均行人延迟减少了82 s,而平均车辆延迟仅增加了0.5 s。
2023-12-14 19:25:11 4.88MB 行业研究
1
延误参数的精确提取对于交叉口的信号配时设计和评价具有重要的研究意义。文章对传统的延误参数提取模型的精度进行了验证,结果表明,以1个周期为分析时长,95%置信度下传统模型得到的参数精度不超过75%。借助于应用日益广泛的视频检测技术,文中给出了2种视频环境下延误参数提取的方法,以1个周期为统计时长,得到新方法提取的参数精度均在85%以上,说明新的方法比传统的模型能够更精确地提取交叉口的延误参数。
2023-05-15 12:26:49 369KB 自然科学 论文
1
预测航空公司延误 使用Hadoop通过2007年和2008年的数据预测奥黑尔机场的航班延误。使用Pig脚本,构建了一个特征矩阵,通过该矩阵我们可以训练和预测航空公司的延误,准确度约为80% 项目详情 建立了一个预测航空公司延误的模型,准确度约为80% 将航空公司数据集与UCI Repo的740万飞行记录一起使用 利用Pydoop实现MapReduce以构建特征矩阵 使用Pig脚本生成功能 使用Python,Scikit-Learn,Pig,Hadoop,HDFS,AWS EMR,IPython构建 技术指标 Python 2.7 Hadoop 2.7.3 Scikit学习 大熊猫 线性回
2022-12-29 17:10:00 6KB python hadoop random-forest scikit-learn
1
1、适合人群:机器学习初学者 2、配套教程使用: Spark项目实战:飞机延误预测项目https://blog.csdn.net/shaock2018/article/details/90286682 3、Spark项目实战:飞机延误预测项目的数据
2022-11-11 18:28:16 153.09MB 机器学习 spark 飞机延误预测 人工智能
1
本文介绍了一个案例研究的结果,该案例研究是中国高铁(HSR)系统中典型服务中断的原因和影响-武广高铁(WH-GZ HSR)– 1096公里高铁线。 十个月的列车运行记录用于评估导致列车服务中断或主要延误的主要事件,以及它们对其他列车运行的影响。 确定了七种主要类型的延误事件,并分析了它们在主要延误延误列车数量方面的影响。 分析表明,无论造成中断的原因是什么,主要的延迟都遵循近似相似的分布模式。 干扰的总体影响(以火车延误的数量来衡量)在很大程度上取决于干扰的类型和位置。 这项研究的分析结果可洞悉高铁运营的关键问题之一-服务中断,这对于制定可靠的列车时刻表和服务管理策略至关重要。
2022-11-08 20:24:23 1.69MB High-speed railway Train operation
1
航空公司延误产生后的航班恢复策略以及相关算法,是国外相关专业的经典书籍
2022-09-12 15:56:53 6.54MB 航空公司 延误管理 航班恢复算法
1
MATLAB车流仿真 包括跟驰、延误_fvd模型仿真,fvd跟驰模型仿真代码
2022-07-28 01:44:16 13KB matlab 车流仿真
1
;Dear sir/madam, Thank you for your order. Shipping address for your order can only be changed prior to your package unshipped. Due to our high efficiency, I am afraid that your package has been shipped yesterday by e-Packet and the shipping address cannot be changed. So please check your package in time in case of losing. Maybe you can ask for your friend or neighbor to help. Hope everything will be fine. Best wishes, (Your name);Dear sir/madam, See your information, we are very sad. It is what
2022-05-19 09:06:47 12.14MB 综合资源 文档资料