该函数用于训练用于矢量量化的码本。 首先将数据集拆分为两个集群,然后找到每个集群的均值(质心)。 找到每个向量与这些质心的距离,并且每个向量都与一个集群相关联。 每个簇的向量均值首先替换质心。 如果总距离没有显着提高,则质心每个都分裂为两个。 这种情况一直持续到达到所需的集群数量并且改进不大。
2021-12-31 05:23:23 4KB matlab
1
机器学习部分聚类 SVM PCA详细代码实例,并附有数据集。
2021-12-30 12:37:09 17.77MB K-means 、SVM、PCA
1
基于matlab的表情识别代码数据挖掘 项目1 在本作业中,您将研究k最近邻,神经网络和SVM分类器在两个实际分类问题上的应用。 用于此分配的数据集已上传到“数据集”文件夹下。 x_train,y_train,x_test和y_test分别表示训练功能,训练标签,测试功能和测试标签。 在x_train和x_test中,每一行代表一个数据样本,每一列代表一个特征。 问题1 人类活动识别数据集是根据对30名志愿者进行的实验而创建的,以使用智能手机数据识别人类活动。 每个人都在腰部佩戴智能手机(三星Galaxy S II)进行六项活动(步行,步行,上楼,下坐,坐着,站立,躺着)。 使用其嵌入式加速度计和陀螺仪,可以以50Hz的恒定速率捕获3轴线性加速度和3轴角速度。 使用信号处理算法处理数据以提取维度561的特征向量。训练集包含7,352个样本,测试集包含2,947个样本。 在此数据集上实现k = 5的k最近邻算法。 使用简单的欧几里德距离度量来计算两个样本之间的距离。 在训练集上训练带有参数2的多项式内核的SVM分类器,并在测试集上进行测试。 您需要为每个课程训练一个SVM。 为了预测测试
2021-12-29 15:56:20 34.77MB 系统开源
1
Matlab代码sqrt 该存储库包含用于产生手稿结果的代码:()。 代码-PCSKM exeSimus.m:运行整个分析并将结果存储在./GenRes/results文件夹中。 该文件包含以下选项: 确定: 0/1开始时不带或带有随机种子。 JMPCKM_OVERLOAD: 0/1使用重载或非重载MPCK-Means。 该库用于MPCK-Means算法。 看 。 CONSTR_PERC: 0/1根据大小使用固定数量的约束或百分比。 日志: (0)无日志文件且无显示,(1)仅日志文件,(2)仅显示,(其他)显示和日志文件。 constraints_type:要使用的约束类型; 0/1激活ML和/或CL,当从所有可用约束中选取-1则随机约束时,则同时选择了1则相等数量的每种类型的牺牲子。 Constraints_number:要使用的固定值或约束的百分比。 citer:每个约束的迭代次数 sstep:要测试的稀疏性参数值,从步骤1.1到sqrt(尺寸),步长为sstep 。 maxIter:算法迭代以达到收敛。 k折:选择k进行k折验证。 CVstatsPer.m:生成有关数据集的统计信
2021-12-28 15:40:03 5.59MB 系统开源
1
关于k-means算法的源程序代码.%%%%%%函数说明%%%%%% %输入: % sample--样本集; % k--聚类数目; %输出: % y--类标; % cnew--聚类中心; % n--迭代次数; function [y cnew n]=k_means(sample,k)
2021-12-28 13:25:55 1KB k-means
1
实时大数据分析k-means算法 报告,源码+数据集 对超市购物记录集basket_row.csv数据集中的商品名称进行聚类,实现同一类商品,不同规格汇聚成一个大类的要求。
2021-12-26 23:16:51 465KB 实时大数据分析 Hadoop Python 广工
1
K-均值可见 K-Means聚类概念的可视化 演示: :
2021-12-26 20:30:43 39KB JavaScript
1
客户细分 该项目是关于使用K-means在购物中心进行客户细分。 该项目中使用的语言是Python。
2021-12-26 15:56:11 428KB JupyterNotebook
1
多维k-means聚类算法java简单实现,导入运行KmeansTest.java可看到结果 多维k-means聚类算法java简单实现,导入运行KmeansTest.java可看到结果
2021-12-26 13:55:21 10KB 多维 k-means 聚类
1