聚类的目标是使同一类对象的相似度尽可能地大;不同类对象之间的相似度尽可能地小。目前聚类的方法很多,根据基本思想的不同,大致可以将聚类算法分为五大类:层次聚类算法、分割聚类算法、基于约束的聚类算法、机器学习中的聚类算法和用于高维度的聚类算法。本源码实现主要选取了基于划分的Kmeans算法和基于密度的DBSCAN算法来对用户地理位置信息进行聚类。 本实验用python实现,依赖numpy, pandas, sklearn, scipy等科学计算library。 数据来自收集得到的用户的地理位置信息,即经纬度数据的序列集。 一种基于DBSCAN和Kmeans的混合算法:先利用DBSCAN算法的密度可达特性将用户的地理位置数据集按照活动半径聚合成若干个簇,并且将每一簇的数据集作为新的输入,再利用Kmeans算法的迭代聚合求出质心的位置,设定K值为1。
2022-06-29 09:13:27 3KB Kmeans DBSCAN 机器学习 聚类算法
1999年31省份消费情况,使用数据时请更改相应的文件名,配合moocPython机器学习应用学习。
2022-06-18 22:03:41 2KB 机器学习 聚类 K-means
1
k均值、合并聚类和DBSCAN聚类算法对鸢尾花数据集聚类代码.zip
2022-06-18 14:07:58 433KB 机器学习 聚类
包含KMeans、DBSCAN、LDA和Single_Pass的文本聚类算法程序(python实现)。 详细信息: 基于KMeans的无监督中文文本聚类 基于DBSCAN的无监督中文文本聚类 基于LDA的无监督文本聚类 基于single pass 策略进行聚类,不需要事先设置类别数
2022-06-14 22:05:33 139KB 机器学习 聚类 文本聚类 课程设计
Airline operation data 某航司2012年3月31日至2014年4月1日相关运营数据。字段解释请查看《客户信息属性说明》。
2022-05-27 11:42:01 4.47MB 机器学习 聚类算法
1
机器学习的五种聚类算法包括训练数据,基于python实现
2022-05-26 13:57:44 10KB 聚类
1
人工智能-机器学习-面向开源软件的聚类搜索系统设计与实现.pdf
2022-05-10 09:08:25 2.53MB 人工智能 机器学习 聚类 文档资料
在“无监督学习”中,训练样本的标记信息是未知的。目标是通过对无标记训练样本的学习来揭示数据的内在性质及规律,为了进一步的数据分析提供基础。
2022-05-04 23:26:09 2.88MB 机器学习 聚类
1
本文对基于 机器 学 习 的 轨迹预测 方法进 行研 究 , 主要完 成 了 如下 工 作 : 研 宄 了 轨迹 信 息 的 处理方法 。 通 过轨迹 预处理 、 空 间 信 息提取 、 时 间 和 方 向 信 息 添加 等系 列 流程 , 将 轨迹数据转换 成 更 易 理解 的 语义信 息 。 提 出 了一种 基 于 多 级 聚类 的 空 间 信 息 提 取方法 。 首 先基 于 时 空一致性扩展 的 停 留 点 提 取方法 , 利 用 滑动 窗 口 与 区 域一致性扩 展 算法 , 提取 出 具有 时 空 相 对 一致性 的 停 留 点 。 再基 于 启 发式 的 增长 聚 类方法 , 提取停 留 区 域 点 。 之后 与 移动 点 合并 , 最终转换 为生活中 的 地 点 名 称 , 使 轨迹 数据 能表 示 出 用 户 的 活动场 所及 移动 过程 。 研 宄 了 基 于深度 学 习 的 轨迹 预测 方法 。 对 处理后 的 轨迹 信息 进行特征 向 量 提取 、 构 建预测模 型 , 充 分利 用 上 下 文 信 息 , 提 高预测 准 确 率 ......
2022-04-27 16:05:51 7.5MB 算法 机器学习 聚类 生活
AGNES和DIANA算法 AGNES (AGglomerative NESting)算法最初将每个对象作为一个簇,然后这些簇根据某些准则被一步步地合并。两个簇间的距离由这两个不同簇中距离最近的数据点对的相似度来确定;聚类的合并过程反复进行直到所有的对象最终满足簇数目。 DIANA (DIvisive ANAlysis)算法是上述过程的反过程,属于分裂的层次聚类,首先将所有的对象初始化到一个簇中,然后根据一些原则(比如最大的欧式距离),将该簇分类。直到到达用户指定的簇数目或者两个簇之间的距离超过了某个阈值。
2022-04-18 21:33:45 4.43MB 机器学习 聚类 最大熵模型 决策树
1