本文主要内容:
聚类算法的特点
聚类算法样本间的属性(包括,有序属性、无序属性)度量标准
聚类的常见算法,原型聚类(主要论述K均值聚类),层次聚类、密度聚类
K均值聚类算法的python实现,以及聚类算法与EM最大算法的关系
参考引用
先上一张gif的k均值聚类算法动态图片,让大家对算法有个感性认识:
其中:N=200代表有200个样本,不同的颜色代表不同的簇(其中 3种颜色为3个簇),星星代表每个簇的簇心。算法通过25次迭代找到收敛的簇心,以及对应的簇。 每次迭代的过程中,簇心和对应的簇都在变化。
聚类算法的特点
聚类算法是无监督学习算法和前面的有监督算法不同,训练数据
1