陈天奇的xgboost课件
2021-09-24 13:33:35 1.23MB xgboost
1
超级GBM | 我们正在招聘! 亲爱的朋友们,我们正在北京为热衷于 AutoML/NAS 的专业人士和实习生开设几个宝贵的职位,请将您的简历/简历发送至 。 (申请截止日期:待定。) 什么是 HyperGBM HyperGBM是一个支持全流水线AutoML的库,完全涵盖了数据清洗、预处理、特征生成和选择、模型选择和超参数优化的端到端阶段,是真正的表格数据AutoML工具。 概述 与大多数专注于解决机器学习算法超参数优化问题的 AutoML 方法不同,HyperGBM 可以将从数据清理到算法选择的整个过程放在一个搜索空间中进行优化。 端到端管道优化更像是一个顺序决策过程,因此 HyperGBM 使用强化学习、蒙特卡洛树搜索、进化算法结合元学习器来有效解决此类问题。 顾名思义,HyperGBM中使用的ML算法都是GBM模型,更准确的说是梯度提升树模型,目前包括XGBoost、Light
2021-09-13 17:55:27 2.09MB tabular-data xgboost semi-supervised-learning gbm
1
xgboost代码回归matlab Kaggle Smartphonr竞赛(Python,R) 这是在智能手机数据集上实现机器学习模型的代码的一部分。 我们的团队根据不同的语言和工具运行了不同的模型。 因此,此python代码只是我们编码工作的一部分。 例如,有时我们需要清理数据集并构建一些模型,例如在R上,这更加方便。 有时Matlab是一种更有效的工具,可以提交给大型集群。 在这项工作中,我们基本上对基于许多基础学习器(例如SVM,Randomforest,Xgboost和LDA ect)的数据集进行18倍交叉验证。 最后,我们使用Xgboost或Logistics回归将它们组合为一个集成模型。
2021-09-10 19:11:53 29.74MB 系统开源
1
Prudential-Life-Insurance-Risk-Prediction:机器学习算法适用于大量申请人数据,以预测其人寿保险风险。 这些算法包括线性回归,决策树,支持向量机(SVM)和XGBoost
2021-08-29 16:20:34 3.85MB R
1
2020/5/26下载git代码后自己用vs生成的,包含xgboost.dll, xgboost.lib ,xgboost.exp的文件
2021-08-27 20:02:58 50.39MB xgboost
1
使用ANN,多元线性回归和XGBoost_regression预测超导临界温度-K 我已经使用ANN,多重Liniear回归和XGBoost_regression来预测超导体材料的临界温度。
2021-08-27 15:35:16 10.46MB JupyterNotebook
1
lightgbm(xgboost)中的焦点损失和标签平滑,用于多类 此损失函数包含焦点损失[1]和标签平滑[2],现在仅支持lightgbm用于多类(类> 3,它将在以后支持xgboost和二进制类问题) 标签平滑 平滑值表示ε的值: 焦点损失 其中alpha,gamma是焦距损失的参数,为: alpha用于不平衡样本,gamma用于难以学习的样本,在多类问题中,alpha似乎毫无用处。 用法: 1.导入损失函数库 import lightgbm as lgb import lossfunction as lf import numpy as np 2.初始化损失函数 focal_loss_lgb = lf.ComplexLoss(gamma = 0.5) param_dist= {'objective':focal_loss_lgb.focal_loss} param_dist['nu
2021-08-24 17:36:36 2KB Python
1
提供了两个文件:xgboost_train和xgboost_test,它们从Matlab内部调用xgboost dll。 该示例用于分类。 可以提供停止学习过程迭代的评估标准。 支持的评估标准是“AUC”、“准确度”、“无”。 'AUC'和'Accuracy'需要统计工具箱。 如果 eval_metric == 'None',则将针对 max_num_iters 执行学习,无需内部交叉验证。 可以使用您自己的“外部”交叉验证程序,它调用 xgboost_train.m。 xgboost_train.m 中记录了此类外部程序的示例 这些函数要求 xgboost.dll 和 xgboost.h 可用。 编译xgboost库并在Matlab中使用的步骤: 视窗: 第 1 步:创建 xgboost.dll 请遵循以下说明: https : //xgboost.readthedocs.io/
2021-08-24 14:17:32 8KB matlab
1
arima的matlab代码个人家庭电力的时间序列预测 日期集: 数据是在 2006 年 12 月至 2010 年 11 月(47 个月)期间以一分钟采样率收集的。 六个自变量(电量和子计量值)一个数值因变量 全球有功功率有 2,075,259 个观测值可用。 我们的目标是预测未来的全球有功功率。 为简单起见,这里删除了缺失值。 此外,我们发现并非所有观察都按日期时间排序。 因此,我们以显式时间戳作为索引来分析数据。 在预处理步骤中,我们对原始数据执行桶平均以减少一分钟采样率的噪声。 为简单起见,我们只关注原始数据集的最后 18000 行(2010 年 11 月的最新数据)。 python文件列表: Gpower_Arima_Main.py :单变量 ARIMA 模型的可执行Python 程序。 myArima.py :使用一些用于 ARIMA 模型的可调用方法实现一个类。 Gpower_Xgb_Main.py :基于树的模型 (xgboost) 的可执行Python 程序。 myXgb.py :实现一些用于 xgboost 模型的函数。 lstm_Main.py :LSTM 模型的可
2021-08-16 21:51:33 15KB 系统开源
1
xgboost代码回归matlab R纽约会议上提到的R包的窗口 我参加了2019年5月10日至5月11日举行的R纽约会议。会议上充斥着许多精彩的演讲。 许多演讲者都很友好,可以分享他们在演讲中使用的R包。 我熟悉一些软件包,但是大多数对我来说都是新的。 这是会议中不同发言人提到的不同R包的简短摘要。 所有软件包名称都链接到其文档。 这里的用例对应于发言人使用的示例。 :专为数据科学设计的R软件包的集合 演讲者:路德米拉·詹达(Ludmilla Janda),Amplify 用例:使用Scratch Box从头开始构建Tidyverse,以向中学生教授数据可视化。 为每个tidyverse组件创建不同的块。 块可以链接在一起以完成任务。 学生仅通过与块进行交互就可以进行数据处理并构建复杂的可视化效果。 :开源机器学习平台,用于监督和无监督算法的并行实现 演讲者:AT&T Labs Research的Emily Dodwell 用例:使用纠结的套索和Boosted树为DirectTV构建推荐系统 : Apache Spark *的R接口 演讲者:AT&T Labs Research的Em
2021-08-16 11:25:46 4KB 系统开源
1