基于豆瓣电影用户数据使用Canopy+K-means聚类的协同过滤推荐 更新对比实验、豆瓣热门电影数据集
2022-12-26 19:31:14 127.42MB 人工智能 python 聚类算法 推荐算法
1
建立实验环境 1个安装python(2.7) 2安装点: 2.1下载pip 2.2解压缩后,安装指令python setup.py install 2.3 pip升级python -m pip install --upgrade pip 2.4 pip安装扩展包pip install jieba(这里以jieba包为例),如果速度较慢,可转换内部的阿里源,即pip install jieba -i --trusted-host mirrors.aliyun.com 3安装pycharm 4使用GitHub获取代码 4.1安装git 4.2登陆自己的GitHub账号,找到自己的项目,(别人的需要先fork过来,也可以直接git clone xxx,或者直接下载zip包放进pycharm) 4.3:pycharm,首先设置git的位置及github账号,点击Test都通过后继续,依次在菜单栏上单击,从版本控制GitHub上进行VCS检出,登陆自己的账号后选择相应的项目,得到代码。 4.4(更新fork的项目到最新的版本)同步叉子 5 ipython协同开发环境 5.
2022-12-23 21:57:16 76.57MB python nlp NaturallanguageprocessingPython
1
印度尼西亚降雨模式分类使用时间序列K均值 使用时间序列k均值对印度尼西亚的三种主要降雨模式进行聚类。 k均值中的距离计算是动态时间规整(DTW),通常用于模式匹配和时间/顺序数据聚类
2022-12-23 21:13:12 2KB
1
根据颜色计算像素簇。 该算法基于Orchard和Bouman描述的uopon二叉树量化技术。 该代码可用于生成混合高斯模型,用于基于图切割的图像分割算法。
2022-12-21 10:32:28 3KB matlab
1
摘要:针对传统配电网区域规划方法无法满足实际需求,而基于传统聚类算法的配电网区域规划方法存在着初始聚类中心选取不合理和聚类个数不确定的问题。文中对传统K-mea
1
针对人工鱼的特点,提出了一种新的聚类分析算法———人工鱼群聚类分析算法。该算法是一种基于网格和密度的聚类分析算法,它能够自动获得簇类数K,能对任意形状的数据库进行聚类,具有较好的并行性,通过网格大小的控制可获得不同层次的聚类结果。它克服了K均值算法要指定簇数K的困难和对球状数据库效果好的缺憾。
2022-12-21 09:03:56 588KB 工程技术 论文
1
2. 类似的,对于社团检测(复杂网络上做聚类),我们有三个关键问题: ·希望得到什么样的社团 2. 计算相似度矩阵S N为一个字典,“节点id—邻接点id集合
2022-12-19 19:53:19 558KB
1
文件夹包含了均值漂移算法的详细讲解,配有PPT,论文及论文中算法的matlab实现,对初学者有很大帮助
2022-12-19 12:20:05 11.44MB 均值漂移 聚类 跟踪
1
使用Python进行文本分析-第二版 自然语言处理从业者指南 文本分析有时会由于文本数据的非结构化和嘈杂的性质以及大量可用信息而变得不堪重负,令人沮丧。 “使用Python进行文本分析”是一本书,其中包含674页有用的信息,这些信息基于技术,算法,经验以及随着时间的推移在分析文本数据时吸取的各种经验教训。 该存储库包含本书中使用的数据集和代码。 我还将不时在此处添加各种笔记本和奖励内容。 继续看这个空间! 拿书 关于这本书 利用Python中的自然语言处理(NLP),并学习如何设置自己的健壮环境来执行文本分析。 第二版经过了重大修改,并根据NLP的最新趋势介绍了一些重大更改和新主题。 您将
1
K均值的时间复杂度为NKTD,其中,N代表样本个数,K代表k值,即聚类中心点个数,T代表循环次数,D代表样本数据的维度。 本算法的改进主要在以下方面: 一, 初始聚类中心点,传统的初始中心点是随机选择,由于K均值算法受初始中心点影响较大,为获得更好的效果,在本方法中,先将数据采用层次聚类的方法预处理,得到的k个中心点作为K均值算法的中心点。 二, 传统的聚类中心点更新是在结束一次循环后,本方法的聚类中心采用实时更新策略,即每次将一个模式归于一个新的聚类中心时,即立刻更新新的所属中心和原属聚类中心的中心值,增强算法的收敛性。 三, 为达到类内方差最小化,类类方差最大化这一原则,考虑到往往设定的K值不一定能很好实现聚类效果,故将以往的固定聚类中心改为一浮动区间。原有K为最小聚类中心个数,另设一聚类中心个数上限maxK。其具体实现如下: 1) 当一待聚类的模式得到其最近中心时,计算该聚类中心类内方差和将此模式归于该中心之后的类内方差,如果两者差别大于某设定阈值,则以该模式数据为基础,得到一新的聚类中心。 2) 当当前聚类中心个数等于设定的最大聚类中心时,合并最相邻的两个聚类。为使得到的聚类效果更为均衡,应该优先合并维度较小的聚类类别。
2022-12-19 08:49:27 1.85MB 层次聚类 K均值 不定K
1