业务需求:对已有交通数据进行分析建立模型,从而对未来交通堵车情况进行预测; # TrafficForecast SparkMLlib智慧交通项目 ## 项目需求 对已有交通数据进行分析建立模型,从而对未来交通堵车情况进行预测 ## 使用步骤 1. 克隆项目到本地 2. 导入项目到IDEA 3. linux中安装配置各软件 4. 阅读代码,运行项目 ## 软件版本 1. hadoop-2.6.4 2. zookeeper-3.4.5 3. kafka_2.12-0.11.0.2 4. jdk-8u181-linux-i586 5. redis-2.6.16 ## 项目思路 ### 生产者模块 - 功能:模拟生产数据,发送到kafka,kafka接收数据后打印到控制台 - 操作步骤 1. 启动zookeeper(三台机器) > [hadoop@mini1 ~]$ zkServer.sh start 2. 启动hadoop > [hadoop@mini1 ~]$ start-all.sh 3. 启动kafka(三台机器) > [hadoop@mini1 kafka_2.12-0.11.0.2]$ bin/kafka-server-start.sh config/server.properties 4. 创建topic > [hadoop@mini1 kafka_2.12-0.11.0.2]$ bin/kafka-topics.sh \ --create \ --zookeeper mini1:2181 \ --replication-factor 1 \ --partitions 1 \ --topic traffic 5. 启动consumer > [hadoop@mini1 kafka_2.12-0.11.0.2]$ bin/kafka-console-consumer.sh \ --zookeeper mini1:2181 \ --topic traffic \ --from-beginning 6. 运行程序Producer ![produce](https://github.com/linwt/TrafficForecast-SparkMLlib/blob/master/picture/produce.png) ### 消费者模块 - 功能:消费kafka数据,并将处理后的数据存储到Redis中 - 操作步骤 1. 启动Redis > 服务端:[hadoop@mini1 redis]# bin/redis-server ~/apps/redis/etc/redis.conf \ > 客户端:[hadoop@mini1 redis]# bin/redis-cli 2. 运行程序SparkConsumer 3. 查看Redis数据库 > 127.0.0.1:6379> select 1 \ > 127.0.0.1:6379[1]> keys * \ > 127.0.0.1:6379[1]> hgetall “20180823_0015” ![redis](https://github.com/linwt/TrafficForecast-SparkMLlib/blob/master/picture/redis.png) ### 数据建模模块 - 功能:读取Redis数据库数据,进行数据建模,并将模型保存到hdfs - 操作步骤 1. 运行程序Train 2. web访问hdfs,查看保存结果 > mini1:50070 ![labelPoint](https://github.com/linwt/TrafficForecast-SparkMLlib/blob/master/picture/labelPoint.png)
2021-10-27 17:02:12 668KB Scala 智慧交通 交通 hadoop
国内计程车数据集,可训练模型,约10万辆车。包括车辆的经纬度、车头朝向、车辆的乘客情况、时间戳等信息。机器学习实际应用数据。
2021-10-21 16:55:40 37.95MB 机器学习 交通数据集 经纬度 车辆坐标
1
Matlab代码sqrt 贝叶斯扩充张量分解 该存储库为以下论文提供了Matlab代码: 陈新宇,何兆成,陈以先,陆玉环,王佳伟(2019)。 贝叶斯增强张量分解模型的缺失交通数据归因和模式发现。 交通运输研究C部分:新兴技术,104:66-77。 [] [] [] [] [] [] 项目结构 BATF代码 BATF_VB.m :主代码文件。 为BATF实现变体推断。 Test_BATF.m :测试文件。 您可以在此处找到一个测试示例。 实用功能 ms_scenario.m :生成具有不同丢失方案的不完整张量。 cp_combination.m :用于因子矩阵上CP组合的函数。 khatrirao_fast.m :快速的Khatri-Rao产品功能。 kr.m :Kronecker产品功能。 mat2ten.m :张量折叠功能。 ten2mat.m :张量展开功能。 vec_combination.m :用于将偏差向量求和到3维张量的函数。 (请考虑使用较新版本的MATLAB) safelog.m :一个安全的对数函数,受。 实验数据集 tensor.mat :原始速度数据。 组织为三
2021-10-20 21:17:09 20.71MB 系统开源
1
AAAI-2021时空融合图神经网络的交通流量预测 要求 这是STFGNN的MXNet实现:[用于交通流量预测的时空融合图神经网络,AAAI 2021]( )。 该框架基于框架构建。 强烈建议您熟悉其管道。 Python3 参见requirements.txt 资料准备 STFGNN在这几个公共交通数据集上实现。 来自PEMS03 , PEMS04 , PEMS07和PEMS08 。 使用密码p72z下载数据 ,并使用tar -zxvf data.tar.gz p72z tar -zxvf data.tar.gz解压缩数据文件。 模型训练 PEMS03,PEMS04,PEMS07,PEMS08: python main_4n0_3layer_12T_res.py --config config/XXXX/individual_3layer_12T.json 训练自己的数据集 (
2021-10-17 09:38:58 26.59MB Python
1
行业资料-交通装置-一种基于张量重建的交通数据丢失恢复方法.zip
18年出租车计程车交通流量数据集用于机器学习约200万记录,包括时间序列、经纬度、车头朝向等详细信息
2021-08-19 20:52:58 25.51MB 机器学习 交通数据集
1
此 Dataset 提供了大量有关法国火车和运输网络的信息。 此数据集包含 2 个 csv 和 1 个形状文件。 file/opensearch/documents/93249/Regularities_by_liaisons_Trains_France.csv file/opensearch/documents/93249/Travel_titles_validations_in_Paris_and_suburbs.csv
2021-07-19 19:56:34 8.48MB 数据集
1
美国高速101数据详细介绍
2021-06-19 09:01:56 357KB 交通数据
1
这是STA 160中流量组的GitHub存储库。成员: 辛西娅·莱 森雄二 王晓彤 我们使用PeMS网站上的数据分析了5年内的湾区交通量。 数据以公路传感器数据的形式出现,并包括流量,速度等点。 我们的分析主要集中在可视化和探索数据的本质上。
2021-06-18 10:52:55 26.8MB HTML
1
kaggle交通数据集,共600+MB
2021-06-12 14:07:34 611.85MB 机器学习 kaggle 交通数据集
1