改进的K-means算法在维文连体段聚类中的应用
2021-11-22 14:41:03 1.42MB 研究论文
1
buades原始NLM算法的C语言实现,速度较慢,
2021-11-22 13:08:48 5KB nonlocal C
1
本地开发和运营 依存关系 确保您已将Python 2.7和pip一起安装。 然后运行: pip install -r requirements.txt 正在运行的工作 使用中央作业运行程序模块src/index.py运行所有作业。 您完全不需要编辑此文件。 python src/index.py 参数: src/spark_jobs.py定义的作业功能名称 生成的簇数 数据文件的文件路径(可以是项目中的绝对路径或本地路径) 这些作业可以占用多个文件。 这些应仅附加到命令中。 例如: python src/index.py user__reputation__to__upvotes_cast 3 tests/fixtures/users.xml 新增工作 所有作业均从src/s
2021-11-22 02:29:49 3.4MB python spark clustering pyspark
1
k-means聚类算法的研究.pdf
2021-11-19 13:01:47 132KB
算法优缺点: 优点:容易实现 缺点:可能收敛到局部最小值,在大规模数据集上收敛较慢 使用数据类型:数值型数据 算法思想 k-means算法实际上就是通过计算不同样本间的距离来判断他们的相近关系的,相近的就会放到同一个类别中去。 1.首先我们需要选择一个k值,也就是我们希望把数据分成多少类,这里k值的选择对结果的影响很大,Ng的课说的选择方法有两种一种是elbow method,简单的说就是根据聚类的结果和k的函数关系判断k为多少的时候效果最好。另一种则是根据具体的需求确定,比如说进行衬衫尺寸的聚类你可能就会考虑分成三类(L,M,S)等 2.然后我们需要选择最初的聚类点(或者叫质心),这里的
2021-11-19 12:27:21 250KB k-means k-means算法 k均值聚类算法
1
项目包含广告渠道90天内额日均UV,平均注册率、平均搜索率、访问深度、平均停留时长、订单转化率、投放时间、素材类型、广告类型、合作方式、广告尺寸和广告卖点等特征,将渠道分类,找出每类渠道的重点特征,为业务讨论和数据分析提供支持。 项目包含原始数据集和源代码
2021-11-19 12:03:25 617KB K-means 广告聚类实现
1
MPI集群 K-Means算法的顺序和并行实现,数据集为数据点,DNA链为输入,K为质心
2021-11-18 22:57:50 351KB Java
1
MNIST | 基于k-means和KNN的0-9数字手写体识别-附件资源
2021-11-18 09:48:31 23B
1
进行乳腺癌诊断的预测分析 使用Python中的K-Means聚类和随机森林算法
2021-11-18 00:26:10 14.22MB JupyterNotebook
1
kmeans聚类学习 K_MEANS.ipynb
2021-11-17 21:05:18 1.69MB 机器学习
1