聚类的目标是使同一类对象的相似度尽可能地大;不同类对象之间的相似度尽可能地小。目前聚类的方法很多,根据基本思想的不同,大致可以将聚类算法分为五大类:层次聚类算法、分割聚类算法、基于约束的聚类算法、机器学习中的聚类算法和用于高维度的聚类算法。本源码实现主要选取了基于划分的Kmeans算法和基于密度的DBSCAN算法来对用户地理位置信息进行聚类。 本实验用python实现,依赖numpy, pandas, sklearn, scipy等科学计算library。 数据来自收集得到的用户的地理位置信息,即经纬度数据的序列集。 一种基于DBSCAN和Kmeans的混合算法:先利用DBSCAN算法的密度可达特性将用户的地理位置数据集按照活动半径聚合成若干个簇,并且将每一簇的数据集作为新的输入,再利用Kmeans算法的迭代聚合求出质心的位置,设定K值为1。
2022-06-29 09:13:27 3KB Kmeans DBSCAN 机器学习 聚类算法
K均值 OvGU Magdeburg 机器学习课程的 k-Means 分类器。
2022-06-21 00:06:38 16KB Java
1
课程作业自己手写的kmeans算法,聚类的个数需要自己制定,算法的速度还可以
2022-06-21 00:00:10 6.86MB k-means
1
采用java编写的一个kmeans算法的程序,参考网上部分实现方法。含有测试数据,可以直接运行得出结果。
2022-06-19 09:39:55 7KB java kmeans 不重复随机数 聚类
1
BELMKN:贝叶斯极限学习机Kohonen网络 无监督的极限学习机(ELM)是一种用于特征提取的非迭代算法。 该方法应用于IRIS数据集以进行非线性特征提取,聚类预测,最后使用k-means进行聚类。 客观的 要使用Unsuoervised Extreme Learning Machine执行非线性特征学习,使用贝叶斯信息准则(BIC)预测数据集中的聚类数,最后使用k-means,自组织图/ Kohonen网络和EM算法进行聚类 模组 无监督的极限学习机:在此模块中,使用无监督的极限学习机执行数据集的特征提取。 这是具有单个隐藏层的非迭代算法,其中输入层和隐藏层之间的权重被随机初始化,并且使用目标函数计算隐藏层和输出层之间的权重。 因此,可以保证收敛于全局最小值。 贝叶斯信息准则:贝叶斯信息准则是一种统计方法,使用d来找出数据集中的聚类数。 它使用期望最大化(EM)算法来查找数据集中的
1
用MapReduce实现KMeans算法,数据的读写都是在HDFS上进行的,在伪分布下运行没有问题。文档中有具体说明。
2022-06-18 12:21:31 13KB MapReduce KMeans Java
1
包含KMeans、DBSCAN、LDA和Single_Pass的文本聚类算法程序(python实现)。 详细信息: 基于KMeans的无监督中文文本聚类 基于DBSCAN的无监督中文文本聚类 基于LDA的无监督文本聚类 基于single pass 策略进行聚类,不需要事先设置类别数
2022-06-14 22:05:33 139KB 机器学习 聚类 文本聚类 课程设计
kmeans聚类matlab代码模板 Python - 100天从新手到大师 Python应用领域和就业形势分析 简单的说,Python是一个“优雅”、“明确”、“简单”的编程语言。 学习曲线低,适合非专业人士 开源系统,拥有强大的生态圈 解释型语言,完美的平台可移植性 支持面向对象和函数式编程 可扩展性,能调用C/C++代码 代码规范程度高,可读性强 目前几个比较流行的领域,Python都有用武之地。 云基础设施 - Python / Java / Go DevOps - Python / Shell / Ruby / Go 网络爬虫 - Python / PHP / C++ 数据分析挖掘 - Python / R / Scala / Matlab 机器学习 - Python / R / Java / Lisp 作为一名Python开发者,主要的就业领域包括: Python服务器后台开发 / 游戏服务器开发 / 数据接口开发工程师 Python自动化运维工程师 Python数据分析 / 数据可视化 / 科学计算 / 大数据工程师 Python爬虫工程师 Python聊天机器人开发 /
2022-06-14 20:04:26 6KB 系统开源
1
模糊聚类的matlab实现,里面有10多个小程序,总有一个适合你。
2022-06-09 15:51:08 13KB FCM kmeans
1