1、内容概要:本资源主要基于XGBoost与LightGBM实现文本分类,适用于初学者学习文本分类使用。 2、数据集为电商真实商品评论数据,主要包括训练集data_train,测试集data_test ,经过预处理的训练集clean_data_train,训练好的word2vec词向量模型w2v_model.pkl和中文停用词表stopwords.txt,可用于模型训练和测试,详细数据集介绍见商品评论情感数据说明文档。 3、源代码:word2vec_analysis.py 是基于Word2Vec进行词向量的生成,采用向量平均求得句向量,然后分别构建RandomForest和GBDT分类模型进行文本分类。 4、源代码:xgboost_model.py是基于xgboost模型对文本进行分类。 5、源代码:lightGBM_model.py是基于lightGBM模型对文本进行分类。
2022-04-16 14:07:38 37.99MB 机器学习 xgboost lightGBM word2vec
lightgbm2.03版本,windows版本,python2和python3都可以用,
2022-04-05 23:14:14 876KB lightgbm
1
DF电商训练赛lightgbm
2022-01-30 16:01:51 8KB 推荐系统
1
lightgbm模型保存为pmml文件 机器学习lgbm模型存为pmml文件, 使用方法查阅附件内容txt文件
2022-01-24 09:02:39 4.48MB 机器学习 人工智能 pmml文件 lightgbm模型
1、lgb模型转换pmml格式
2022-01-23 09:05:16 5.04MB jar java pmml 模型
高级工具库xgboost/LightGBM与建模实战:xgboost应用和实践,LightGBM
2021-12-09 14:50:21 7.46MB xgboost LightGBM 建模实战
1
本文件主要基于微软开源的LightGBM项目,对其中的application.h,application.hpp,predictor.hpp文件进行修改,添加用于实时预测的C++ API ,方便用户部署预测速度飞快的C/C++线上预测模型。
2021-12-07 19:56:52 22.01MB LightGBM C++/API 预测模块
1
m5-forecasting-lightgbm-kaggle
2021-12-06 17:42:56 5KB JupyterNotebook
1
LightGBM 的 MATLAB 包装器
2021-12-04 15:42:26 11KB matlab
1
本文主要参考Battle of the Boosting Algos: LGB, XGB, Catboost,结果与原文有出入。 文章目录1. 对比标准1.1 数据集1.2 规则1.3 版本2. 结果2.1 准确率2.2 训练时间和预测时间2.3 可解释性2.3.1 特征重要性2.3.2 SHAP值2.3.3 可视化二叉树3. 总结4. 代码参考文献 1. 对比标准 1.1 数据集 分类:Fashion MNIST(60000条数据784个特征) 回归:NYC Taxi fares(60000条数据7个特征) 大规模数据集:NYC Taxi fares(2百万条数据7个特征) PS:本文只进行
2021-11-29 22:43:14 435KB atb lightgbm st
1