占士邦
公司债券评级变化预测模型
团队成员:Wes Sapone,Kwame van Leeuwen,Ketan Patel,Susan Fan
目标:开发一种机器学习模型,该模型可以预测未来12个月公司债券的信用等级变化
概括
通过SQL从活跃于公司信用违约概率建模的公司中获取大型数据集。 数据清理在该项目中发挥了重要作用。 3个分类模型:使用Logistic回归,随机森林和梯度提升来训练/测试模型并分析大型历史数据框。 事实证明,拥有相对较少的评分事件的不平衡数据集是一个关键挑战。 使用原始的不平衡数据集,Random Forest和Gradient Boost模型似乎优于Logistic回归模型,其平衡精度得分约为83%。 将来可能进行的建模改进包括增强数据集,微调模型和优化目标变量。
演示幻灯片
数据清理
楷模
逻辑回归
随机森林
原始数据,默认参数1
随机森林原始数据,
1