K _means算法的python代码实现
2021-12-07 20:38:02 4KB K-MEANS python
1
1、无监督学习 没有目标值(变量)的算法 常见的无监督学习算法: 降维: – 主成分分析PCA降维处理 聚类: – K-means(k均值聚类) 2、主成分分析 应用PCA实现特征的降维 ·定义:高维数据转化为低维数据的过程,在此过程中可能会舍弃原有数据、创造新的变量 ·作用:是数据维散压缩,尽可能降低原数据的维数(复杂度),损失少量信息。 ·应用:回归分析或者聚类分析当中 PCA的APA: ·sklearn.decomposition.PCA(n_components=None) – 将数据分解为较低维数空间 n_components: ·小数:表示保留百分之多少的信息 ·整数:减少到多少特
2021-12-07 18:52:02 152KB k-means k-means算法 mean
1
模糊C均值算法 类型:聚类算法 使用的数据集:虹膜数据集 要求: Google colab或jupyter笔记本 套餐: 熊猫-https: numpy- //numpy.org/install/ Matplotlib- //matplotlib.org/stable/users/installing.html sklearn- //scikit-learn.org/stable/install.html 涉及的步骤: 打开“ fuzzy_c_means_algorithm_implementation.ipynb”文件。您可以在Google colab上或通过jupyter笔记本打开它。 如果您使用的是Jupyter笔记本,请安装上述必需的软件包。 在google colab或jupyter Notebook中打开文件后,运行所有单元格并查看输出。 观察图以了解算
1
数据挖掘算法k-means,使用Python实现
2021-11-23 22:05:02 115KB k-means Python
1
利用Python实现数据挖掘经典算法K-means,K-means坐标点由random随机生成。
2021-11-23 21:58:29 1KB Python K-means 随机生成坐标
1
改进的K-means算法在维文连体段聚类中的应用
2021-11-22 14:41:03 1.42MB 研究论文
1
算法优缺点: 优点:容易实现 缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢 使用数据类型:数值型数据 算法思想 k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的,相近的就会放到同一个类别中去。 1.首先我们需要选择一个k值,也就是我们希望把数据分成多少类,这里k值的选择对结果的影响很大,Ng的课说的选择方法有两种一种是elbow method,简单的说就是根据聚类的结果和k的函数关系判断k为多少的时候效果最好。另一种则是根据具体的需求确定,比如说进行衬衫尺寸的聚类你可能就会考虑分成三类(L,M,S)等 2.然后我们需要选择最初的聚类点(或者叫质心),这里的
2021-11-19 12:27:21 250KB k-means k-means算法 k均值聚类算法
1
MPI集群 K-Means算法的顺序和并行实现,数据集为数据点,DNA链为输入,K为质心
2021-11-18 22:57:50 351KB Java
1
使用C语言对传统K-means聚类算法进行了实现,内含较多注释。
2021-11-17 09:04:04 4KB k-means C
1
针对传统K-means算法易受初始聚类中心和异常数据的影响等缺陷,利用萤火虫优化算法全局搜索能力强、收敛速度快的优势,对K-means算法的初始聚类中心进行优化,并通过引用一种加权的欧氏距离,减少异常数据等不确定因素带来的不良影响,提出了一种基于萤火虫优化的加权K-means算法。该算法在提升聚类性能的同时,有效增强了算法的收敛速度。在实验阶段,通过UCI数据集中的几组数据对该算法进行了聚类实验及有效性测试,实验结果充分表明了该算法的有效性及优越性。
2021-11-15 15:38:43 1.72MB 加权K-means 聚类 萤火虫算法
1