项目概况 开发环境:Jupyter Notebook(Anaconda3的应用包下) 项目描述 一、获取数据集并预处理 在网上(例如Kaggle)下载数据集,读入数据并进行数据预处理。 二、根据特征群进行可视化分析 数据总体分成三大特征群,逐一分析各特征群下,每个特征在特征群中的重要程度,在客户流失因素上的重要程度。对数据进行可视化分析,通过饼状图的对比,对各项特征指标有一个直观的清晰的 认识。 三、特征工程与类别平衡 数据预测前一系列处理,先进行特征工程处理,结合皮尔逊相关系数,把无用特征进行剔除,完善字符编码格式。再处理类别不平衡的问题(正负样本数相差较多,易导致数据倾斜或不准确)。 四、模型使用与评估 使用机器学习模型与模型评估方式,用K折交叉验证计算方式,分别对逻辑回归,随机森林,AdaBoost,XGBoost模型进行评估,得出预测模型的准确度,后续选择其中之一进行实际预测,并输出模型中的特征重要性。 五、总结分析与制定决策 总结分析,合并各客户的预测流失率与真实流失率,形成关系表。运营商可以根据分组情况的结果设定阈值并进行决策,从而确定分界点进行客户召回措施。
2024-06-28 13:06:06 10.88MB Kaggle
1
Java基于机器学习进行软件系统故障预测系统源码.zip
2024-06-27 09:37:26 216KB java
1
针对某一具体问题(例如,可以来源于当前时事和大学学习、生活、竞赛等紧密相关的topic(如天气、生态环境、各类竞赛等)),采用机器学习算法实现其分类、识别、预测等。 如:基于SVM的图像分类或回归,通过特征参数提取,训练得到SVM模型,再利用该模型对图像进行分类;或用深度学习模型来自动提取特征+预测等等。 1. 题目(选个有意思、吸引眼球、言简意赅的题目很重要); 2. 中英文摘要和关键词; 3. 背景(问题描述,应用意义,研究现状,存在挑战,解决方案等); 4. 原理方法(对所用的机器学习算法进行原理介绍,图,文,公式,重点是模型的输入输出参数); 5. 解决方案(对所解决问题的方案进行详细描述,重点解决方案中的模型,图,文,公式,模型参数训练,特征提取,学习算法等); 6. 实验结果分析(给出所实现的结果,图文描述(含该模型的过拟合分析),若有对比结果可加分); 7. 结论(描述本文所解决的问题,与传统方法的优势,还存在哪些待解决的问题);
2024-06-26 13:39:29 24.86MB 机器学习 聚类 课程设计 预测模型
1
PEMS 数据集是由美国加利福尼亚州的交通部门联合其他伙伴机构建立的统一公开交通数据库。美国加利福尼亚州的交通部门在交通路网上大约设置了超过39000 个交通监测站,交通管理部门安装在路网上的各类传感器可以实时地收集所在高速公路上的交通状况信息,越是接近市区人口密集的地区,传感器布置的也越密集,从分布上来看,这些传感器大多被安置在靠近市区的路段上。PEMS提供了超过十年的历史交通状况数据,整合了有关加州运输公司以及其他交通机构系统的各类信息。 PemsD7 交通数据集:数据由分布在加利福尼亚州高速公路系统(CalTrans)中选择 228 个站点数据。数据集从30 秒的数据样本聚合到5 分钟的时间间隔内。时间范围在 2012 年5 月和6 月的工作日的228 个站点交通速度信息,数据包括邻接矩阵和特征矩阵。 邻接矩阵是通过分析已有时空交通数据的特性,构建一种新的具有相似交通流量模式的 矩阵,特征矩阵是每个传感器节点的时间序列特征矩阵。
2024-06-24 10:18:24 40.78MB 深度学习 交通预测 数据挖掘 交通网络
1
本博客将介绍一种新的时间序列预测模型——FNet它通过使用傅里叶变换代替自注意力机制,旨在解决传统Transformer模型中的效率问题。FNet模型通过简单的线性变换,包括非参数化的傅里叶变换,来“混合”输入令牌,从而实现了快速且高效的处理方式。这种创新的方法在保持了相对较高的准确性的同时,显著提高了训练速度,特别是在处理长序列数据时更显优势。FNet的工作原理,并通过一个实战案例展示如何实现基于FNet的可视化结果和滚动长期预测。预测类型->多元预测、单元预测、长期预测。适用对象->受硬件所限制的时候,FNet是一种基于Transformer编码器架构的模型,通过替换自注意力子层为简单的线性变换,特别是傅里叶变换,来加速处理过程。FNet架构中的每一层由一个傅里叶混合子层和一个前馈子层组成(下图中的白色框)。傅里叶子层应用2D离散傅里叶变换(DFT)到其输入,一维DFT沿序列维度和隐藏维度。总结:FNet相对于传统的Transformer的改进其实就一点就是将注意力机制替换为傅里叶变换,所以其精度并没有提升(我觉得反而有下降,但是论文内相等,但是从我的实验角度结果分析精度是有下降的
1
大气预测软件calpuff桌面版安装程序32位,轻松处理气象和污染源数据,完成大气预测模拟。
2024-06-20 16:53:21 86.64MB calpuff 大气预测
1
1. Matlab实现BP神经网络的数据分类预测(完整源码和数据) 2. 多变量输入,单变量输出(类别),数据分类预测 3. 评价指标包括:准确率 和 混淆矩阵 4. 包括拟合效果图 和 混淆矩阵 5. Excel数据,要求 Matlab 2018B及以上版本
2024-06-19 17:35:12 73KB 机器学习 神经网络 Matlab 分类算法
1
机器学习期末作业 数据集来源:Kaggle泰坦尼克号罹难乘客生存预测 https://www.kaggle.com/c/titanic/data 代码编辑器:Jupyter Notebook 论文排版:LaTex
2024-06-19 16:53:38 106KB Kaggle
环境影响评价大气预测软件,对一个项目的污染物、污染源、项目特征和气象数据进行录入、保存和必要的预处理。项目特征包括背景图及其定位、地形高程、现状监测数据以及敏感点和厂界线定义。环评软件工具
2024-06-15 18:17:18 65.27MB 大气预测软件 eiaproa 环境影响评价
1
灰狼算法(GWO)优化回升状态网络ESN回归预测,GWO-ESN回归预测模型,多输入单输出模型。 评价指标包括:R2、MAE、MSE、RMSE和MAPE等,代码质量极高,方便学习和替换数据。 灰狼算法(GWO)优化回升状态网络ESN回归预测,GWO-ESN回归预测模型,多输入单输出模型。 评价指标包括:R2、MAE、MSE、RMSE和MAPE等,代码质量极高,方便学习和替换数据。
2024-06-14 22:49:20 37KB 网络 网络