K-means聚类算法 简介 聚类是一个将数据集中在某些方面相似的数据成员进行分类组织的过程,聚类就是一种发现这种内在结构的技术,聚类技术经常被称为无监督学习。 K均值聚类是最著名的划分聚类算法,由于简洁和效率使得他成为所有聚类算法中最广泛使用的。给定一个数据点集合和需要的聚类数目k,k由用户指定,k均值算法根据某个距离函数反复把数据分入k个聚类中。 算法 先随机选取K个对象作为初始的聚类中心。然后计算每个对象与各个种子聚类中心之间的距离,把每个对象分配给距离它最近的聚类中心。聚类中心以及分配给它们的对象就代表一个聚类。一旦全部对象都被分配了,每个聚类的聚类中心会根据聚类中现有的对象被重新计算
2021-12-22 20:07:13 84KB ab atl b函数
1
对银川市各地区水资源承载能力评估,基于投影寻踪模型和加速遗传算法的石羊河流域水资源承载力综合评价等资料介绍。
2021-12-22 17:18:46 302KB 基于遗传算法 投影寻踪聚类模型
1
使用K均值的客户细分 使用K-Means聚类算法根据新近度,频率和货币价值(RFM)指标对客户进行细分
2021-12-22 12:59:42 1.5MB JupyterNotebook
1
模糊C均值聚类分割算法,经测试分割效果良好,载入图像数据,直接调用即可
2021-12-21 22:13:35 1KB 模糊C均值
1
som matlab代码K均值聚类 Matlab中的K均值聚类算法在本节中,目的是在Matlab中使用聚类算法,并发现自组织图(SOM)神经网络如何将虹膜花朵拓扑分类成类,从而提供对花朵类型的深入了解和有用的工具进行进一步分析。 自组织图神经网络可以将鸢尾花按拓扑分类成类,从而提供对花朵类型的深入了解以及进一步分析的有用工具。 SOM是(1)竞争性学习人工神经网络(ANN)(2)地图的每个单元都减少相同的输入。 (3)单元竞争选择(4)修改所选节点及其邻居。 文件中包含用于检测人脸的matlab代码。
2021-12-21 20:03:02 2.76MB 系统开源
1
论文研究-基于自适应权重的面板数据聚类方法.pdf,  基于二维信息的传统聚类方法并不适用于处理面板数据, 在考察面板数据多重信息特征的基础上, 基于面板数据的"绝对指标", "增量指标"及"波动指标", 重构了面板数据相似性测度的距离函数和Ward聚类算法, 提出了面板数据自适应权重聚类方法. 所提供的算法既可退化为传统的绝对量距离聚类方法, 亦可对面板数据的未来所属类别进行聚类预测. 最后, 实例显示此方法兼具有效性和灵活性.
2021-12-21 15:23:22 963KB 论文研究
1
Customer_satisfaction_Analysis 结果整合 Demo 演示 基于用户 UGC 的在线民宿满意度挖掘,负责数据采集、主题抽取、情感分析等任务。开发的目的是克服用户打分和评论不一致,实现了在线评论采集和用户满意度分析。 主要功能包括在线原始评论采集、主题聚类、评论情感分析与结果可视化展示等四个模块,如下所示。 提取后的民宿地址和在线评论等信息如下。 搭建了百度地图 POI 查询入口,可以进行自动化的批量查询地理信息。 通过高频词可视化展示,归纳出评论主题。 构建了基于在线民宿语料的 LDA 自动化主题聚类模型,利用主题中心词能找出对应的主题属性字典,并使用用户打分作为标注,然后通过多种分类模型,选用最优模型对提出的评价主体 进行情感分析,针对主题属性表进行主题提取后的文本进行情感分析,分别得出当前主题对应的情感趋势,横坐标为所有关于主题为“环境”的情感得分,纵坐标为
1
ss_08_聚类算法大苏打实打实打算.py
2021-12-21 09:03:17 6KB up
1
spss聚类分析,详细步骤,适用于零基础学习
2021-12-21 00:38:14 2.49MB spss 聚类分析步骤
1
用数据文件【004期】SPSS聚类分析.sav做实例分析。 为了研究亚洲国家或地区的经济发展和文化教育水平,以便对亚洲国家和地区进行分类研究,进行聚类分析。
2021-12-20 23:49:15 523KB SPSS
1