数据挖掘机器学习[七]---2021研究生数学建模B题空气质量预报二次建模求解过程:基于Stacking机器学习混合模型的空气质量预测{含码源+pdf文章}
2022-04-23 22:05:21 9.76MB 机器学习 数据挖掘 stacking
焦点堆叠 该脚本是使用Dask和Memory映射数据对进行的优化重做,可实现更快,更稳定的执行。
2022-01-12 20:48:47 6.18MB Python
1
作业1-数据科学2 @ CEU 2020-2021 由 该包含在为DS2课程的首次作业分配最终HTML报告时使用的所有代码,数据文件和输出。建议将整个存储库以ZIP格式下载,或将其克隆到本地计算机上,并将其根文件夹设置为R Project。这将使您无缝运行代码和功能。 特别鸣谢: 在他的课程中提供了进行数据分析的代码,功能和指南的框架 提供的辅助函数框架
2021-12-22 16:03:57 3.08MB HTML
1
本文来自于博客园,本文主要使用机器学习算法来将个体机器学习器的结果结合在一起,这个方法就是Stacking,希望对您的学习有所帮助。 Ensemblelearning中文名叫做集成学习,它并不是一个单独的机器学习算法,而是将很多的机器学习算法结合在一起,我们把组成集成学习的算法叫做“个体学习器”。在集成学习器当中,个体学习器都相同,那么这些个体学习器可以叫做“基学习器”。个体学习器组合在一起形成的集成学习,常常能够使得泛化性能提高,这对于“弱学习器”的提高尤为明显。弱学习器指的是比随机猜想要好一些的学习器。在进行集成学习的时候,
1
堆叠分类器 堆叠分类器以预测客户是否将退出银行
2021-12-06 16:59:11 260KB JupyterNotebook
1
销量预测一直是一个热点研究的课题,对于各个企业有着重要的意义.近年来,随着深度学习的崛起,用于销量预测的模型越来越多,而单一模型的预测性能往往不够理想,所以出现了越来越多的组合模型.本文利用Stacking策略将XGBoost、支持向量回归(Support Vector Regression,SVR)、GRU神经网络作为基础模型,然后将LightGBM作为最终的预测模型,并且融合了新的特征.集中了几种模型的优势,大大提高了模型的预测性能,更加接近真实的销量数据,为回归预测提供一种新的预测方法.
1
mlxtend 包,由Sebastian Raschka开发的一个工具集,初衷也是写下一些在其他包中没有找到的特定算法,是一个机器学习扩展工具库,属于开源文件,仅作个人兴趣使用
2021-11-17 16:12:28 39.54MB 机器学习
1
算法模型的融合,使用xgboost,ligbm等继承学习进行融合
2021-11-17 16:07:10 10KB 算法
1
堆叠ClockWork_RNN 对于时间序列,分为两个部分: 发条递归神经网络的部分自回归,每日时间序列。 刑罚数据部分的相关因素,每季度的时间序列。 用最小二乘法训练体重。 叠加,将两个预测与权重结合在一起。
2021-11-10 20:53:30 849KB Python
1
堆码 简述 主要的三类集成学习方法为装袋,提升和堆叠。目前,大型的数据挖掘比赛(如Kaggle),排名靠前的基本上都是集成机器学习模型或深度神经网络。 将训练好的所有基模型对整个训练集进行预测,第$ j $个基模型对第i个训练样本的预测值将作为新的训练集中第$ i $个样本的第$ j $个特征值,同理,预测的过程也要先经过所有基模型的预测形成新的测试集,最后再对测试集进行预测。 具体原理讲解参考,简单来说,集成学习其实都是将基本模型组合形成更优秀的模型,Stacking也不例外。stacking是各个算法训练全样本的结果再用一个元算法融合这些结果,它可以选择使用网格搜索和交叉验证。 Mlxtend框架 基本上,现代传统机器学习领域的库基本上被sciket-learn(sklearn)占领,如果你没有使用过sklearnlib,那就不能使用过机器学习算法进行数据挖掘。但是,自定义集成学习库依
2021-09-17 14:58:46 6KB 系统开源
1