泰坦尼克号
这是我在参加 Kaggle 泰坦尼克号比赛时编写的 python/scikit-learn 代码。 有几种不同算法的代码,但主要和性能最高的一种是在 randomforest2.py 中实现的 RandomForest。
要求:
python(2.x 版本至少为 2.6)
scikit-learn/NumPy/SciPy ( )
熊猫( )
matplotlib ( )
用法: > python randomforest2.py
关键文件:
loaddata.py:包含所有特征工程,包括用于生成不同变量类型、执行 PCA、聚类和类平衡的选项
randomforest2.py:执行管道的代码
scorereport.py:检查并报告超参数搜索的结果
learningcurve.py:包括生成学习曲线的代码
roc_auc:包括生成 ROC 曲线的代码
其他文
2022-05-25 21:02:15
63KB
Python
1