堆叠(堆叠概括)
总览
简单实用的堆叠库,用Python编写。
用户可以使用scikit-learn,XGboost和Keras的模型进行堆叠。 作为该库的功能,训练后可以保存所有失叠的预测以供进一步分析。
描述
(有时被称为堆叠泛化)涉及训练学习算法的其他几个学习算法的预测结合起来。 基本思想是使用一组基础分类器,然后使用另一个分类器组合其预测,以减少泛化误差。
对于理解堆栈和集成学习非常有帮助。
用法
请参阅工作示例:
要运行这些示例,只需运行sh run.sh 注意:
在数据/输入下设置训练和测试数据集
从原始数据集创建的要素必须位于数据/输出/要素下
堆栈模型在scripts文件夹下的scripts.py中定义
需要在该脚本中定义创建的功能
只需运行sh run.sh ( python scripts/XXX.py )。
详细用法
设置火车数据集及其目标数据和测试数据集。
FEATURE_LIST_stage1 = {
'train' :(
INPUT_PATH + 'train.csv'
1