上传者: 42131785
|
上传时间: 2022-02-12 21:17:09
|
文件大小: 508KB
|
文件类型: -
此代码从我们的团队“carl and snow”生成了 Tradeshift 文本分类的第一名解决方案
它主要包括两种模型:
使用 Xgboost 和 sklearn 的两阶段模型。
在线逻辑回归。
依赖关系 Python 2.7 pypy 2.4.0 Scikit learn-0.15.2 numpy 1.7.1 scipy 0.11.0 Xgboost 0.3
要生成解决方案:
设置所有依赖
更改 run.py 中的数据目录
更改 ./src/xgb_classifier.py 中的 xgboost 包装器路径
Python运行.py
最佳单解:xgb-part1-d18-e0.09-min6-tree120-xgb_base.csv private LB 0.0044595
最佳集成解决方案:best-solution.csv 私有 LB 0.0043324(第一名)