BRSMM 类实现了用于模拟和估计有限简单混合模型参数的算法。 简单模型,例如潜在狄利克雷分配 (LDA) 模型,通常用于基于文本的信息检索,例如,根据单词统计为语料库中的每个文档指定主题时。 BRSMM 类是 LDA 对连续数据的扩展。 它专为包含异常值和/或缺失值的数据而设计。 BRSMM 对象将每个主题建模为具有特定主题参数的重尾分布的混合。 根据贝叶斯范式,参数配备了共轭先验分布。 该模型还包含表示数据中缺失值和数据质量的隐藏变量。 参数和隐藏变量的后验分布通过近似变分推理算法进行估计。 此提交包括一个测试函数,该函数生成一组合成数据并从这些数据中学习模型。 测试函数还绘制根据模型聚类的数据,以及每次迭代后数据的边际对数似然的变分下界。 如果您发现此提交对您的研究/工作有用,请引用我的 MathWorks 社区资料。 如果您有任何技术或应用相关问题,请随时直接与我联系。
2022-08-29 15:26:31 19KB matlab
1
MATLAB kmeans聚类分割(GUI,分割聚类数可以输入),可输入一张彩色图像,可以选择需要分割成多少类,就会以不同颜色区分不同的块,带有GUI界面,操作丰富。
1
这里面是机器学习里面聚类所需的数据集,分为人工的二维数据集,如月牙形,双螺旋型等,和UCI真实数据集,是我搜集好久才弄出来的,有一些二维数据集是自己生成的,提供给大家做算法实验。
2022-08-26 21:26:32 2.44MB 聚类数据集
1
数据流聚类相关知识以及Stream、CluStream、Birch算法的讲解
2022-08-25 16:45:33 500KB 数据流聚类 Stream CluStream
1
异常值matlab代码RFM-SCAN:使用带有大量异常值的空间聚类进行稳健的特征匹配 (TIP2020) 在 Matlab 2016b 上成功测试。 如果您将此存储库中的代码用作已发布研究项目的一部分,请引用本文。 姜星宇、马佳一、姜俊军和郭小杰。 “使用带有大量异常值的空间聚类进行鲁棒特征匹配”,IEEE 图像处理汇刊,2020 年。
2022-08-22 15:31:49 1.46MB 系统开源
1
为了将图像中内容特征相近的像素尽可能分割到同一区块,提高图像分割的针对性和自适应性,提出了一种基于有序数据聚类的图像自适应分条算法。该算法首先计算图像中所有像素点的梯度值,相加每列像素梯度值得到列累积能量;然后对能量数据进行加权平滑生成连续曲线,用该平滑曲线的凹凸性自适应确定图像分条总数;最后构造图像列累积能量数据的条件距离矩阵,由已确定的分条数采用系统聚类的方法实现图像分条。分条实验结果对比表明,提出的算法能根据不同图像内容自适应地进行图像条分割,且将分条结果应用于图像内容感知缩放研究中可获得满意的缩放效果,因此该算法能较好地对图像内容进行分类和识别。
1
10.2.2 聚类分析 聚类是将物理或抽象对象的集合分成若干由类似的对象组成的多个类 的过程。由聚类生成的簇是一组数据对象的集合,这些对象与同一个簇中的 对象彼此相似,与其他簇中的对象相异。现在聚类分析广泛应用于生物、经 济、社会、人口等领域的大量量化分类问题的研究中,也是数据处理、数据挖 掘中最主要的内容之一。聚类分析内容非常丰富,有系统聚类法、动态聚类 (K均值聚类)法、有序样品聚类法和模糊聚类法等。 在实际应用中,有时样品之间有先后次序且不能变动,在同一类中的样 品要求次序相邻的,这类问题称为有序样品的聚类分析。例如对动植物按生 长的年龄段进行分类,年龄的顺序是不能改变的,否则就没有实际意义了;在 地质勘探中,需要通过岩心了解地层结构,此时按深度顺序取样,样品的次序 也不能打乱;在证券交易中,对行情的研判必须与交易时间相对应,今天赚钱 的品种在昨天或者明天都可能严重亏损。 10.2.3 上证综指的聚类 表10-1是2010年7月16日到2011年7月15日整一年共243个交易日 的上证综指收盘价(来自同花顺交易软件),图10-1是相应的散点折线图。 ·781·
2022-08-21 23:41:47 12.77MB 文字非扫描 中文高清版 pdf
1
传统的K-modes算法采用简单的属性匹配方式计算同一属性下不同属性值的距离,并且计算样本距离时令所有属性权重相等。在此基础上,综合考虑有序型分类数据中属性值的顺序关系、无序型分类数据中不同属性值之间的相似性以及各属性之间的关系等,提出一种更加适用于混合型分类数据的改进聚类算法,该算法对无序型分类数据和有序型分类数据采用不同的距离度量,并且用平均熵赋予相应的权重。实验结果表明,改进算法在人工数据集和真实数据集上均有比K-modes算法及其改进算法更好的聚类效果。
2022-08-21 23:37:28 527KB 论文研究
1
DBSCAN 聚类,是一种基于密度的聚类算法,它类似于均值漂移,DBSCAN 与其他聚类算法相比有很多优点,首先,它根本不需要固定数量的簇。它也会异常值识别为噪声,而不像均值漂移,即使数据点非常不同,也会简单地将它们分入簇中。另外,它更抗噪音,能够很好地找到任意大小和任意形状的簇。DBSCAN的聚类过程就是根据核心弱覆盖点来推导出最大密度相连的样本集合,首先随机寻找一个核心弱覆盖样本点,按照 Minpts 和 Eps 来推导其密度相连的点,然后再选择一个没有赋予类别的核心弱覆盖样本点,开始推导其密度相连的样本结合,一直迭代到所有的核心样本点都有对应的类别为止。作者博客中详细介绍了DBSCAN的算法原理,可以通过文章结合学习,代码包含详细注释,只需要导入自己的聚类数据,运行代码便可以得出聚类结论与图像。
2022-08-16 13:05:39 4KB DBSCAN 数学建模 python 算法
1
机器学习-系统聚类手算
2022-08-11 20:05:09 7.77MB 机器学习
1