信用评估是商业银行等机构防范风险的重要途径,为了提高信用评估的准确率,使用随机森林(RF)来建立风险评估模型。针对随机森林模型的性能与参数的选择和数据集不平衡比例密切相关,提出了一种基于随机森林的组合分类算法(KM-GA-RF)。以UCI数据库中的German数据集进行研究,通过K-means算法对标签进行类分解。而对于哪个类分成的簇数(ki)以及随机森林算法自身的参数:树数(n_estimators)、特征数(max_features),使用改进的遗传算法对其进行优化选取。实验结果表明,基于随机森林的组合优化模型与传统RF以及其他算法进行比较,RF的预测精度高于支持向量机等算法,达到0.765,而提出的组合优化模型的预测精度为0.815,提高了5%。
1
支持向量机作为非参数方法已经广泛应用于信用评估领域.为克服其训练高维数据不能主动进行特征选择导致准确率下降的缺点,构建C4.5决策树优化支持向量机的信用评估模型.利用C4.5信息熵增益率方法进行属性选择,减少冗余属性.模型通过网格搜索确定最优参数,使用F-score和平均准确率评价模型性能,并在两组公开数据集上进行验证.实证分析表明,C4.5决策树优化支持向量机的信用评估模型有效减少了数据学习量,较于传统各类单一模型有较高的分类准确率和实用性.
1
一种基于聚类的个人信用评估分类模型,陈新泉,,本文先介绍了个人信用评估的概念及评估模型大致的发展历程,从而很自然地得出采用数据挖掘的方法与技术来建立信用评估模型是一个
2022-06-11 21:25:35 231KB 信用评估模型 聚类分类 近邻扩展
1
iDataCoding 个人信用评估(拓展可不写)
2022-05-16 21:54:10 1.36MB 单片机 python iDataCoding
文章针对SVM中的参数选择问题,提出了利用遗传算法进行优化的方法,并将其应用于商业银行的个人信用评估中,构建了个人信用评估GA-SVM模型;通过对GA适应度函数的设置来控制个人信用评估中给商业银行造成较大损失的“取伪”误判的发生;模型的应用结果表明,GA-SVM模型能够对样本数据进行较好的分类,并且“取伪”误判得到了控制。
2022-05-11 15:01:39 350KB 自然科学 论文
1
【达摩老生出品,必属精品,亲测校正,质量保证】 资源名:MATLAB神经网络原理与实例精解_matlab_基于BP网络的个人信贷信用评估 资源类型:matlab项目全套源码 源码说明: 全部项目源码都是经过测试校正后百分百成功运行的,如果您下载后不能运行可联系我进行指导或者更换。 适合人群:新手及有一定经验的开发人员
个人信用评估是现代商业银行个人信用管理的核心.本文将数据挖掘中的随机森林算法(RandomForests,RF)运用到现代个人信用评估模型中,实现了逐步优化和评估.
2022-01-18 20:36:40 247KB 数据挖掘 信用 评估
1
Features of Random Forests It is unexcelled in accuracy among current algorithms. It runs efficiently on large data bases. It can handle thousands of input variables without variable deletion. It gives estimates of what variables are important in the classification. It generates an internal unbiased estimate of the generalization error as the forest building progresses. It has an effective method for estimating missing data and maintains accuracy when a large proportion of the data are missing. It has methods for balancing error in class population unbalanced data sets. Generated forests can be saved for future use on other data. Prototypes are computed that give information about the relation between the variables and the classification. It computes proximities between pairs of cases that can be used in clustering, locating outliers, or (by scaling) give interesting views of the data. The capabilities of the above can be extended to unlabeled data, leading to unsupervised clustering, data views and outlier detection. It offers an experimental method for detecting variable interactions.
2022-01-18 16:01:07 1.54MB 随机森林
1
影响个人信用的因素很多。 将套索技术引入个人信用评估,分别建立套索逻辑,套索支持向量机和组套索逻辑模型。 变量选择和参数估计也同时进行。 根据某贷款平台的个人信用数据集,可以通过实验得出结论,与全变量Logistic模型和逐步Logistic模型相比,Group Lasso-Logistic模型的变量选择能力最强,其次是套索物流和套索SVM。 这三个基于套索变量选择的模型都具有比逐步选择更好的过滤能力。 同时,组套索逻辑模型可以消除或保留相关的虚拟变量作为一个组,以方便模型解释。 在预测准确性方面,Lasso-SVM在训练集中对默认用户的预测准确性最高,而在测试集中,Group Lasso-logistic对默认用户的分类准确性最高。 无论是在训练集中还是在测试集中,套索逻辑模型对于非默认用户都具有最佳分类精度。 基于套索变量选择的模型还可以更好地筛选出影响个人信用风险的关键因素。
1
信用评等模型/信用评估模型之12堂课,非常好的一本书。
2021-12-16 13:19:37 46.7MB 建模 信用模型 银行 金融
1