信用评估是商业银行等机构防范风险的重要途径,为了提高信用评估的准确率,使用随机森林(RF)来建立风险评估模型。针对随机森林模型的性能与参数的选择和数据集不平衡比例密切相关,提出了一种基于随机森林的组合分类算法(KM-GA-RF)。以UCI数据库中的German数据集进行研究,通过K-means算法对标签进行类分解。而对于哪个类分成的簇数(ki)以及随机森林算法自身的参数:树数(n_estimators)、特征数(max_features),使用改进的遗传算法对其进行优化选取。实验结果表明,基于随机森林的组合优化模型与传统RF以及其他算法进行比较,RF的预测精度高于支持向量机等算法,达到0.765,而提出的组合优化模型的预测精度为0.815,提高了5%。
1
k-means聚类算法及matlab代码贝叶斯非参数小方差渐近聚类 这是贝叶斯非参数小方差渐近聚类算法库:DP均值,动态均值,DP-vMF均值,DDP-vMF均值。 出于比较原因,该库还实现了k均值和球形k均值。 该库带有一个可执行文件,该可执行文件允许使用DP-vMF-means,DP-means,球形k-meansk-means进行批量聚类。 示出了算法的简单性。 有关使用DDP-vMF-means的示例,请参考,该文档依赖于此程序包的dpMMlowVar库使用DDP-vMF-means从Kinect RGB-D流执行实时方向分割。 如果您使用DP-vMF手段或DDP-vMF手段,请引用: Julian Straub, Trevor Campbell, Jonathan P. How, John W. Fisher III. "Small-Variance Nonparametric Clustering on the Hypersphere", In CVPR, 2015. 如果您使用动态均值,请引用: T. Campbell, M. Liu, B. Kulis, J. How
2023-02-27 22:55:23 2.59MB 系统开源
1
图像压缩矢量量化 使用随机初始化对聚类中心进行图像压缩的 k-means 的实现
2023-02-27 22:16:07 202KB MATLAB
1
在Python中使用K-Means聚类和PCA主成分分析进行图像压缩 各位读者好,在这片文章中我们尝试使用sklearn库比较k-means聚类算法和主成分分析(PCA)在图像压缩上的实现和结果。 压缩图像的效果通过占用的减少比例以及和原始图像的差异大小来评估。 图像压缩的目的是在保持与原始图像的相似性的同时,使图像占用的空间尽可能地减小,这由图像的差异百分比表示。 图像压缩需要几个Python库,如下所示: # image processing from PIL import Image from io import BytesIO import webcolors # data analy
2023-02-27 22:15:11 267KB ns 主成分分析 聚类
1
针对K-means算法易受随机选择的初始聚类中心的影响和划分准确率不高的缺点,给出了一种改进的K-means算法。首先对初始聚类中心的选择过程进行了改进,然后对各样本点间差异最大的维进行加权处理。在Iris数据集上对原始算法和改进后的K-means算法的聚类结果进行对比分析。实验证明:改进后的算法稳定,且聚类的准确率达到了92%。
2023-02-10 03:10:05 932KB 自然科学 论文
1
基于Hadoop的K-Means聚类算法优化与实现,陈萍,何健伟,本文针对传统K-Means聚类算法不适合海量大数据挖掘,并且对异常离群点数据非常敏感,结合Hadoop云计算平台以及MapReduce并行编程框架,��
2023-01-15 11:32:23 361KB K-Means算法;大数据;Hadoop;并行;
1
kmeans 分析matlab代码K均值聚类 这是K-means算法在MATLAB和Python中的简单实现 K-means 聚类是一种矢量量化方法,最初来自信号处理,在数据挖掘中流行用于聚类分析。 k-means聚类旨在将n个观测值划分为k个簇,其中每个观测值都属于具有最近均值的簇,作为簇的原型。 这导致将数据空间划分为 Voronoi 单元。 该代码实现了 K-means 算法并在一个简单的 2D 数据集上对其进行了测试。 例子 在这个例子中,我们首先从三个正态分布生成一个点数据集并标记数据集。 这个带有正确标签的数据集是我们的真实值。 然后我们重新调整标签并为新数据集运行 k-means 算法。 该算法正确地对数据集进行聚类,并估计聚类的中心。 在最后一步,我们将我们的结果与 Mathworks 实现的 k-means 的结果进行比较。 结果 我在我的机器上得到的结果如下: iteration: 1, error: 1.8122, mu1: [-0.2165 4.0360], mu2: [4.2571 0.0152], mu3: [-1.1291 -3.0925] iterati
2023-01-12 08:52:42 86KB 系统开源
1
数学建模有关的算法代码,MATLAB的基本实现,智能算法k-means,聚类算法的代码实例,通过了解基本原理知道分类方法,通过随机生成数据来模拟,实现基本的聚类情况,可在原有代码基础上改进。
2023-01-05 00:57:27 2KB 机器学习 数学建模 分类 MATLAB
1
Approximation Algorithms for K-Modes Clustering,何增友,,In this paper, we study clustering with respect to the k-modes objective function, a natural formulation of clustering for categorical data. One of the main contributions of this p
2022-12-28 15:33:15 223KB Clustering Categorical Data K-Means
1
印度尼西亚降雨模式分类使用时间序列K均值 使用时间序列k均值对印度尼西亚的三种主要降雨模式进行聚类。 k均值中的距离计算是动态时间规整(DTW),通常用于模式匹配和时间/顺序数据聚类。
2022-12-23 21:13:12 2KB
1