上传者: 42107374
|
上传时间: 2021-10-19 20:42:18
|
文件大小: 49.15MB
|
文件类型: -
PDP盒
python部分依赖图工具箱
更新! :cat_with_tears_of_joy:
版本更新:
xgboost==1.3.3
matplotlib==3.1.1
sklearn==0.23.1
动机
该存储库受ICEbox启发。 目的是可视化某些功能对任何监督学习算法的模型预测的影响。 (现在支持所有scikit-learn算法)
常见头痛
当使用黑盒机器学习算法(如随机森林和增强算法)时,很难理解预测变量与模型结果之间的关系。
例如,就随机森林而言,我们所获得的只是功能的重要性。 尽管根据重要性计算可以知道哪个功能对结果产生了显着影响,但确实令人遗憾的是,我们不知道它在哪个方向上产生影响。 在大多数实际情况下,效果是非单调的。
我们需要一些强大的工具来帮助理解预测变量和模型预测之间的复杂关系。
强调
辅助功能用于可视化目标分布以及预测分布。
处理一键编码功能的正确方法。
解决功能之间复杂的相互依赖性的解