机器学习聚类算法学习文档
2022-08-11 11:05:34 9.69MB 机器学习
1
弗雷德 快速,可扩展且轻量级的C ++Fréchet距离库,暴露于python,专注于多边形曲线的(k,l)聚类。 成分C ++后端 import Fred.backend as fred 线程数 默认情况下,Fred将自动确定要使用的线程数。如果要设置上限,请调用fred.set_maximum_number_threads(number) 。 曲线 签名: fred.Curve(np.ndarray) , fred.Curve(np.ndarray, str name) 属性: fred.Curve.values :曲线为np.ndarray , fred.Curve.name :获取曲线的名称, fred.Curve.dimensions :曲线的尺寸, fred.Curve.complexity :曲线的点数 曲线图 签名: fred.Curves() 方法: fred.Curv
2022-08-09 22:41:27 107KB python time-series clustering dimension-reduction
1
- K 表示算法使用不同的初始质心执行以获得最佳聚类。 - 总成本的计算方法是将每个点到其聚类中心的距离相加,然后对所有聚类求和。 - 基于在 'iterKMeans' 每次迭代期间实现的最小总成本,将像素分配给它们各自的集群,并获得最终的压缩图像。 - 随着集群数量、图像大小和迭代次数的增加,该算法运行速度将变慢。
2022-08-08 01:42:49 1.2MB matlab
1
根据方差分析理论,提出应用混合F统计量来确定最佳分类数,并应用模糊划分熵来验证最佳分类数的正确性,综合运用上述两个指标可以准确确定最佳聚类数。通过实际算例说明这两个指标的有效性。
1
matlab 花代码超可扩展光谱聚类和集成聚类 概述 该存储库提供了两种大规模聚类算法的 Matlab 源代码,即Ultra-Scalable Spectral Clustering (U-SPEC)和Ultra-Scalable Ensemble Clustering (U-SENC) ,它们都具有近乎线性的时间和空间复杂度和能够在具有 64GB 内存的 PC 上稳健高效地对千万级非线性可分数据集进行分区。 如果您发现此存储库对您的研究有帮助,请引用下面的论文。 Dong Huang, Chang-Dong Wang, Jian-Sheng Wu, Jianhuang Lai, and Chee-Keong Kwoh. Ultra-Scalable Spectral Clustering and Ensemble Clustering, IEEE Transactions on Knowledge and Data Engineering (TKDE), 2020, vol.32, no.6, pp.1212-1226. DOI: https://doi.org/10.1109/TK
2022-07-30 20:56:38 24.15MB 系统开源
1
主要技术:Python / jieba / TF-IDF / MultinomialNB / KMeans / editdistance / TopN 项目简介:通过分析不同机构发布的文章,判断是否有文章抄袭的情况,并找到原文和抄袭的文章,以及具体相似的句子。可以应用于毕业论文查重,IP作品及文本抄袭检测。 主要工作:对采集的文档进行数据清洗,采用TF-IDF提取文本特征,使用朴素贝叶斯分类器进行写作风格分类,并针对模仿自己写作风格的文章进行抄袭检测。先采用聚类算法对文档进行聚类降维,针对预测写作风格一致的作品,进行相似度检测及编辑距离检测。
2022-07-26 17:06:53 2.27MB 文本抄袭 python 机器学习 聚类分析
1
执行 k-mediods 聚类; 只需要一个距离矩阵 D 和簇数 k。 查找集群分配“inds”以最小化以下成本函数: sum(D(inds==i,inds==i),2),对 i=1:k 求和确定集群分配和集群中心都是以高效的矢量化方式完成的。 集群分配是 O(nk) 集群中心是 O(k*(最大集群大小)^2)
2022-07-21 16:49:58 2KB matlab
1
matlab fcm函数代码聚类 探索聚类方法的项目 背景 该存储库包含Matei关于群集的Rmd讲座。 我还建议您下载Young / Old FlowRepository数据集。 为此: 安装FlowRepositoryR软件包 使用该程序包,检索FR-FCM-ZZGS数据集 查看此git存储库中的代码,以获取有关如何进行质量控制和数据预选门的建议/指导 之后,玩得开心! 尝试FlowSOM。 考虑一下您自己的聚类和总体识别想法。 寻找在新老受试者之间差异显着的T细胞亚群。 年轻/旧数据集 该数据集由美国纽约州罗彻斯特市的David H. Smith疫苗生物学与免疫学中心罗彻斯特人体免疫学中心创建。 目的是使用SWIFT的竞争性聚类分配方法来测量老年人/年轻人中PBMC亚群之间的差异。 SWIFT是一种非常好的聚类方法,可在MATLAB中实现,如所述。 不幸的是,由于它是在MATLAB(这是一个可商购的系统)中实现的,因此您可能无法自己运行它。 但是,您可以将结果与已发布的SWIFT结果进行比较。 质量控制和门控 此仓库中包含三个包含我的R代码的文件。 yo_utils.R 该文件包
2022-07-19 18:10:15 11.17MB 系统开源
1
针对极化SAR(PolSAR)遥感图像分割,提出了一种空间受限的核模糊C均值(SCKFCM)算法。 与经典的模糊C均值(FCM)算法相比,核方法可以执行从原始空间到核空间的非线性映射。 因此,SCKFCM不受遥感图像数据分布的影响。 此外,为了克服斑点噪声的影响,在目标函数中增加了空间约束项,可以有效地提高图像分割的准确性。 PolSAR图像分割的实验结果证明了所提出的SCKFCM方法的有效性。
2022-07-19 18:03:39 1017KB nonlinear mapping; polarimetric SAR
1
专题资料(2021-2022年)ArcGIS应用之基于密度的聚类分析.docx
2022-07-19 12:01:35 1006KB 互联网
1