AGNES和DIANA算法 AGNES (AGglomerative NESting)算法最初将每个对象作为一个簇,然后这些簇根据某些准则被一步步地合并。两个簇间的距离由这两个不同簇中距离最近的数据点对的相似度来确定;聚类的合并过程反复进行直到所有的对象最终满足簇数目。 DIANA (DIvisive ANAlysis)算法是上述过程的反过程,属于分裂的层次聚类,首先将所有的对象初始化到一个簇中,然后根据一些原则(比如最大的欧式距离),将该簇分类。直到到达用户指定的簇数目或者两个簇之间的距离超过了某个阈值。
2022-04-18 21:33:45 4.43MB 机器学习 聚类 最大熵模型 决策树
1
对于同心圆以及近似同心圆的聚类方法,适合于聚类进阶学习 对于同心圆以及近似同心圆的聚类方法,适合于聚类进阶学习 对于同心圆以及近似同心圆的聚类方法,适合于聚类进阶学习
2022-04-07 10:25:58 1KB 机器学习 聚类
1
资源特点:基于课程作业,一共有三个案例 1.1 使用 sklearn 的 DBSCAN 和 GaussianMixture 完成聚类 1.2 使用 sklearn 的 KMeans 完成聚类 1.3 实现 K-means 每个案例配有详细的代码和解释,都能测试通过。 机器学习第八章实验内容 详细内容见第七周实验内的 jupyter notebook。 一、实验内容 1.1 使用 sklearn 的 DBSCAN 和 GaussianMixture 完成聚类 1. 使用 sklearn 的 DBSCAN 和 GaussianMixture 在两个数据集上完成聚类任务 2. 对聚类结果可视化 3. 对比外部指标 FMI 和 NMI 4. 选做:调整密度聚类的 eps 参数,绘制聚类结果 1.2 使用 sklearn 的 KMeans 完成聚类 1. 使用 sklearn 的 Kmeans 完成两个数据集的聚类任务 2. 计算外部指标 FMI 和 NMI 3. 对聚类结果可视化 1.3 实现 K-means 1. 实现一个 K-means 聚类算法 2. 计算外部指标 FMI 和 NMI
2022-02-24 19:09:10 1.55MB python jupyter 机器学习 聚类
1
二维人工数据集:6个 数据 xxx.txt 标签 xxx_cl.txt UCI真实数据集:10个 数据 xxx.txt 标签 xxx_label.txt
2022-02-12 14:14:21 925KB 机器学习 聚类 分类算法 数据集
1
无监督学习-kmeans聚类算法及手动实现jupyter代码.ipynb
2021-12-04 13:13:35 818KB 机器学习 聚类
1
【完整课程列表】 清华大学精品数据挖掘&机器学习学习PPT课件(31页)含练习题 第1章 数据挖掘概念介绍.pptx 清华大学精品数据挖掘&机器学习学习PPT课件(31页)含练习题 第5章 综合实战:日志的挖掘与应用.pptx 清华大学精品数据挖掘&机器学习学习PPT课件(34页)含练习题 第2章 分类 Bayes贝叶斯 SVM支持向量机分类算法.pptx 清华大学精品数据挖掘&机器学习学习PPT课件(38页)含练习题 第6章 数据挖掘应用案例 电力分析 银行信贷 指数预测 客户分群营销 房屋估价.pptx 清华大学精品数据挖掘&机器学习学习PPT课件(39页)含练习题 第4章 关联规则 Apriori FP-Growth算法.pptx 清华大学精品数据挖掘&机器学习学习PPT课件(42页)含练习题 第3章 聚类算法介绍.pptx
2021-11-23 19:09:09 21.12MB 数据挖掘 机器学习 聚类算法 关联规则
Python数据分析与机器学习-聚类实践 Python数据分析与机器学习-聚类实践
2021-11-19 11:31:54 3KB python
1
至此聚类相关的内容告一段落,前面十篇博客介绍了常见的几种聚类算法,也加入了一些代码实现。这篇博客来一个汇总的实例,分别创建圆形数据、月牙形数据、聚团数据以及随机数据,并测试不同数据在各种不同聚类算法中的聚类效果以及消耗时间。 import time import warnings import numpy as np import matplotlib as mpl import matplotlib.pyplot as plt from sklearn import cluster from sklearn import datasets as ds from sklearn.neighbo
2021-11-04 15:43:48 432KB 分布 学习 数据
1
用python爬取虎扑体育https://nba.hupu.com/stats/players中球员数据,包括球员姓名、球队、得分、命中-出手、命中率、命中-三分、三分命中率、命中-罚球、罚球命中率、场次、上场时间等数据,对数据进行整理并存入MySQL数据库,并且以散点图和雷达图展现出球员数据,对数据进行标准化处理,然后使用聚类算法将球员进行聚类,最后呈现出6个簇的聚类结果。
2021-10-27 10:04:43 20KB 爬虫 机器学习
1
压缩包中包含算法的Python实现代码、测试数据集及运行结果,可供感兴趣的同学参考。因为现在的实现并不能对所有的数据集都得到良好的效果,所以如果哪位同学有更好的想法,希望能不吝赐教。
2021-09-24 20:43:52 190KB 机器学习 聚类算法 无监督学习
1