上传者: 38727567
|
上传时间: 2022-03-18 10:55:49
|
文件大小: 9.95MB
|
文件类型: -
smote的matlab代码破产预测
挖掘波兰破产数据
标签:数据挖掘、机器学习、数据可视化。
共同创建
链接:
项目介绍:
数据集:
概括:
破产预测是预测公司破产和财务困境的各种措施的任务,由于债权人和投资者在评估公司可能破产的可能性时具有相关性,因此很重要。
预测财务困境的目的是开发一个预测模型,该模型结合了各种计量经济参数,可以预测公司的财务状况。
在这个项目中,我们在探索、构建和比较一些广泛使用的分类模型时记录了我们的观察结果:
高斯朴素贝叶斯
逻辑回归
决策树
随机森林
极端梯度提升
平衡装袋
我们选择了波兰公司的破产数据集,其中使用合成特征来反映更高阶的统计数据。
我们首先进行数据预处理和探索性分析,其中我们使用一些流行的数据插补技术来插补缺失的数据值,如均值、k-最近邻、期望最大化和链式方程
(MICE)
的多元插补。
为了解决数据不平衡问题,我们应用合成少数类过采样技术(SMOTE)对少数类标签进行过采样。
稍后,我们使用
K
折交叉验证对上述模型以及插补和重采样数据集对数据进行建模。
最后,我们使用准确率、准确率、召回率等多个指标分析和评估模型在验证数据集上的性能,