业务需求:对已有交通数据进行分析建立模型,从而对未来交通堵车情况进行预测; # TrafficForecast SparkMLlib智慧交通项目 ## 项目需求 对已有交通数据进行分析建立模型,从而对未来交通堵车情况进行预测 ## 使用步骤 1. 克隆项目到本地 2. 导入项目到IDEA 3. linux中安装配置各软件 4. 阅读代码,运行项目 ## 软件版本 1. hadoop-2.6.4 2. zookeeper-3.4.5 3. kafka_2.12-0.11.0.2 4. jdk-8u181-linux-i586 5. redis-2.6.16 ## 项目思路 ### 生产者模块 - 功能:模拟生产数据,发送到kafka,kafka接收数据后打印到控制台 - 操作步骤 1. 启动zookeeper(三台机器) > [hadoop@mini1 ~]$ zkServer.sh start 2. 启动hadoop > [hadoop@mini1 ~]$ start-all.sh 3. 启动kafka(三台机器) > [hadoop@mini1 kafka_2.12-0.11.0.2]$ bin/kafka-server-start.sh config/server.properties 4. 创建topic > [hadoop@mini1 kafka_2.12-0.11.0.2]$ bin/kafka-topics.sh \ --create \ --zookeeper mini1:2181 \ --replication-factor 1 \ --partitions 1 \ --topic traffic 5. 启动consumer > [hadoop@mini1 kafka_2.12-0.11.0.2]$ bin/kafka-console-consumer.sh \ --zookeeper mini1:2181 \ --topic traffic \ --from-beginning 6. 运行程序Producer ![produce](https://github.com/linwt/TrafficForecast-SparkMLlib/blob/master/picture/produce.png) ### 消费者模块 - 功能:消费kafka数据,并将处理后的数据存储到Redis中 - 操作步骤 1. 启动Redis > 服务端:[hadoop@mini1 redis]# bin/redis-server ~/apps/redis/etc/redis.conf \ > 客户端:[hadoop@mini1 redis]# bin/redis-cli 2. 运行程序SparkConsumer 3. 查看Redis数据库 > 127.0.0.1:6379> select 1 \ > 127.0.0.1:6379[1]> keys * \ > 127.0.0.1:6379[1]> hgetall “20180823_0015” ![redis](https://github.com/linwt/TrafficForecast-SparkMLlib/blob/master/picture/redis.png) ### 数据建模模块 - 功能:读取Redis数据库数据,进行数据建模,并将模型保存到hdfs - 操作步骤 1. 运行程序Train 2. web访问hdfs,查看保存结果 > mini1:50070 ![labelPoint](https://github.com/linwt/TrafficForecast-SparkMLlib/blob/master/picture/labelPoint.png)
2021-10-27 17:02:12 668KB Scala 智慧交通 交通 hadoop
任务目标:基于所给数据集对饭店流量指标进行预测 不限方法,不限工具包使用。最终目标需给出预测结果,此题重在考察数据处理与建模能力 air_visit_data.csv数据集为饭店每天客流数据,其中visitors为标签 air_store_info.csv数据集为饭店所处位置信息数据 date_info.csv数据集为日历数据 sample_submission.csv为测试数据集,即提交结果(注意其格式,处理时需要把ID和日期分别提取,即预测每个饭店每天的流量情况) weather文件夹为气象台下载数据,有能力的同学可以尝试加入天气特征,时间紧的话可以暂时不考虑这个 提示:请尝试对各个数据集进行特征提取,并整合特征,其中日期与时间指标可以做出来很多特征,大家可以多多尝试,需要提交的测试数据及并非标准格式,需要一些基本的预处理,即预测每个饭店每天的流量情况,处理测试集的时候需先对测试集补全所需特征,例如是否为节假日,星期几,区域信息等。
2021-10-13 18:04:07 41.42MB 数据挖掘
电力负荷预测 正在短期电力负荷预测的研究生项目中。 数据取自网站的并且在项目过程中实施了多个时间序列算法。 实施的模型: models文件夹包含在项目过程中实现的所有算法/模型: 前馈神经网络 简单移动平均线 加权移动平均 简单指数平滑 霍尔茨·温特斯 自回归综合移动平均 递归神经网络 长短期记忆单元 门控循环单位细胞 脚本: aws_arima.py ARIMA模型适合上一个月的数据,并预测每天的负载。 aws_rnn.py RNN,LSTM,GRU符合最近2个月的数据,并预测每天的负载。 aws_smoothing.py SES,SMA,WMA适合上一个月的数据,并预测每天的负载。 aws.py调度程序,每天00:30 IST运行上述三个脚本。 pdq_search.py用于根据最近一个月的数据对ARIMA模型的超参数进行网格搜索。 load_scra
2021-10-13 14:47:12 7.91MB machine-learning ses lstm gru
1
当工业设备发生故障时,导致的问题往往不是更换设备的费用,而是被迫停机。一条生产线静止不动可能意味着每分钟损失数千美元。定期维护可以帮助避免计划外停机,但不能保证设备不会发生故障。如果机器能显示出某个部件何时会发生故障呢?甚至如果机器能告诉您哪个部件需要更换呢?这样一来,计划外停机时间将大大减少。计划的维护只在必要时进行,而不是以固定的时间间隔进行。这便是预测性维护的目标:通过使用传感器数据预测何时需要维护,以此来避免停机。在任何预测性维护算法的开发过程中,核心都是传感器数据,传感器数据可以用来训练故障检测的分类算法。在预处理步骤中,将从这些数据中提取出有意义的特征,并使用这些特征训练用于预测性
1
定性预测、回归预测、时间序列平滑预测、趋势曲线模型预测、季节变动预测、马尔科夫预测、确定型决策、非确定型决策、风险型决策、贝叶斯决策、多目标决策等。通过学习,使学生掌握基本预测理论与方法,培养学生根据实际条件选择并建立模型进行预测与决策的能力
2021-09-11 20:27:12 178KB 统计预测与决策大纲
1
微粒群算法结合灰色系统理论进行预测matlab代码.zip
2021-08-09 11:03:26 3KB matlab
PredRNN 包含PyTorch的纸张实现- PredRNN:使用时空LSTM进行预测性学习的递归神经网络 数据集 移动MNIST数据集可在下载 建筑
2021-07-14 12:46:04 8KB nlp deep-learning lstm spatio-temporal
1
使用Keras训练好的模型用来直接进行预测,这个时候我们该怎么做呢?【我这里使用的就是一个图片分类网络】 现在让我来说说怎么样使用已经训练好的模型来进行预测判定把 首先,我们已经又有了model模型,这个模型被保存为model.h5文件 然后我们需要在代码里面进行加载 model = load_model(“model.h5”) 假设我们自己已经写好了一个load_data函数【load_data最好是返回已经通过了把图片转成numpy的data,以及图片对应的label】 然后我们先加载我们的待预测的数据 data, labels = load_data(<the path of th
2021-07-07 23:58:21 44KB AS ras 操作
1
人工神经网络进行预测的Matlab程序其中包括好几种例子-人工神经网络进行预测的Matlab程序 其中包括好几种例子.rar 人工神经网络进行预测的Matlab程序 其中包括好几种例子
2021-06-25 22:38:24 6KB matlab
1