基于深度学习的生物信息学聚类方法 ”期刊的“”中发表的论文“基于深度学习的生物信息学聚类方法”的代码和补充材料。 此仓库将定期更新。 特别是,将添加更完整的Jupyter笔记本。 在本文中,我们回顾了基于深度学习的聚类分析方法,包括网络训练,表示学习,参数优化和制定聚类质量指标。 我们还讨论了在不同的场景(例如生物成像,基因表达聚类)中,基于不同的自动编码器体系结构(例如,香草,变异,LSTM和卷积)的表示学习如何比基于ML的方法(例如,PCA)更有效。 ,以及将生物医学文本聚类。 基于深度学习的无监督/聚类方法,链接到论文和代码 我们提供了基于深度学习的无监督/聚类方法,论文链接和代码的列表。 此外,还将列出提出新方法和论文的文章。 敬请期待! 标题 文章 会议/期刊 代码 卷积自动编码器(DCEC)的深度聚类 ICONIP'2017 用于一致性培训(UDA)的无监督数据增强 Arx
1
The code of Local Gravitation Clustering, see in the paper "Clustering by Local Gravitation " http://ieeexplore.ieee.org/document/7915751 citation: Z. Wang et al., "Clustering by Local Gravitation," in IEEE Transactions on Cybernetics, vol. 48, no. 5, pp. 1383-1396, May 2018. For Chinese readers who visit this page from my dissertation: 我的毕业论文的知网CAJ格式中很多图表显示有问题, 可能的原因是知网的CAJ格式对矢量图的支持不好, 而我提交的pdf版
2023-03-02 10:08:11 5KB matlab
1
当提供不适当的参数或将其应用于由具有不同形状,大小和密度的聚类组成的数据集时,大多数聚类算法将变得无效。 为了缓解这些不足,我们提出了一种新颖的拆分合并层次聚类方法,其中采用最小生成树(MST)和基于MST的图来指导拆分和合并过程。 在分割过程中,选择基于MST的图中具有高度的顶点作为初始原型,并使用K均值来分割数据集。 在合并过程中,将对子组对进行过滤,并且仅考虑相邻对。 所提出的方法除了簇数以外不需要任何参数。 实验结果证明了其在合成和真实数据集上的有效性。
2023-02-25 08:54:26 1.76MB Data sets; Hierarchical clustering
1
nmi指数matlab代码演示快速入门 运行 demo.m。 这可以在 30 个测试数据集上为以下两种聚类方法重现图 4A 中的结果。 ND-Ward-E(KT) :2020年Pattern Recognition上发表的拟议聚类方法(标题:邱和李的“Enhancing In-Tree-based Clustering via Distance Ensemble and Kernelization”); ND-K :一种比较方法(Qiu 等人。“最近下降、树内和聚类”,arXiv:1412.5902v2,2014 年)。 注:a) ND-K 是 ND-Ward-E(KT) 的基础; b) 对于 ND.m,低版本 Matlab 中可能不存在函数“maxk”; 在这种情况下,可以使用 ND.m 中它后面的以下代码代替(我们在 ND.m 中突出显示了它)。 推荐方法介绍:ND-Ward-E(KT) 最近,我们提出了一种新的受物理启发的方法,称为最近下降(ND),它的作用是将所有样本组织成一个有效的图,称为 in-tree(图 1A)。 由于其有效的特性,这种 in-tree 证明非常适合数据
2023-02-08 17:32:39 36.53MB 系统开源
1
DNS(域名系统)在引导Internet流量方面提供了关键功能。 保护DNS服务器免受带宽攻击是DNS服务提供商的一项重要任务。 传统的基于规则的异常或入侵检测方法无法动态更新规则。 基于数据挖掘的方法能够在海量动态查询流量数据中找到各种模式。 这些模式可以帮助DNS服务提供商实时检测异常。 本文提出了一种新颖的频繁情节挖掘算法,以及一种可以实时检测异常的体积趋势预测方法。 基于查询量时间序列的特征,采用基于密度的聚类方法将多个域名划分为不同的组。 提出了一种一致的情节挖掘方法,以发现查询流量如何在不同域名之间的不同时间“传播”。 实验是对实字DNS日志数据集进行的。 提出了有趣的模式,表明基于数据挖掘的方法在DNS服务领域中是合适且有希望的。
2022-12-29 15:31:56 640KB Data mining; Clustering; Frequent
1
Approximation Algorithms for K-Modes Clustering,何增友,,In this paper, we study clustering with respect to the k-modes objective function, a natural formulation of clustering for categorical data. One of the main contributions of this p
2022-12-28 15:33:15 223KB Clustering Categorical Data K-Means
1
欢迎。 该存储库包含基于Matlab的“ GBK-means聚类算法的实现:基于讨价还价博弈的K-means算法的改进”。 在该存储库中,提供了GBK-means聚类算法的源代码,并将其与两种众所周知的聚类算法K-means和Fuzzy cmeans进行比较。 关于通用有效性指标,已经对人工和现实世界的数据集进行了比较。 提出的方法是一种新的机制,用于解决集群中心相互竞争以吸引最多数量的相似对象或实体进入其集群的集群分析问题。
2022-12-11 16:43:24 16KB matlab
1
kmapper_law_analysis 使用拓扑数据分析和Mapper算法进行韩国法律数据分析 安装与执行 先决条件 Python(> = 3.6) NumPy Scikit学习 openpyxl 1.克隆 $ git clone https://github.com/zeebraa00/kmapper_law_analysis.git 2.安装软件包 $ pip install numpy $ pip install -U scikit-learn $ pip install openpyxl 3.制作数据的自定义距离矩阵 $ python make_metric.py 我们专注于法律的参照关系。 启动距离矩阵。 (将所有法则之间的距离设置为1。) 扫描朝鲜语先例时,可缩短同一先例中使用的法律之间的距离。 完成的距离矩阵将保存为二进制文件。 (law_data / cus
2022-12-09 11:05:33 5.65MB data-clustering tda kepler-mapper sckit-learn
1
这是论文“Density Peak Clustering-based Noisy Label Detection for Hyperspectral Image Classification, IEEE Transactions on Geoscience and Remote Sensing, 2018, (Accepted)”的代码,更多细节可以在论文中找到。 如果你使用这个演示,请引用这篇论文。 要运行此演示,您应该先下载 libsvm-3.22。 libsvm-3.22 可在https://www.csie.ntu.edu.tw/~cjlin/libsvm/ 获得
2022-11-30 10:29:35 9KB matlab
1
将物理或抽象对象的集合分成由类似的对象组成的多个类的过程被称为聚类。由聚类所生成的簇是一组数据对象的集合,这些对象与同一个簇中的对象彼此相似,与其他簇中的对象相异。“物以类聚,人以群分”,在自然科学和社会科学中,存在着大量的分类问题。聚类分析又称群分析,它是研究(样品或指标)分类问题的一种统计分析方法。聚类分析起源于分类学,但是聚类不等于分类。聚类与分类的不同在于,聚类所要求划分的类是未知的。聚类分析内容非常丰富,有系统聚类法、有序样品聚类法、动态聚类法、模糊聚类法、图论聚类法、聚类预报法等。
2022-11-28 12:21:56 814KB clustering no teacher
1