第二十章 聚类分析SAS程序设计.doc
2022-05-31 22:04:52 194KB 文档资料
距离选择的原则 (1)要考虑所选择的距离公式在实际应用中有明确的意义。如欧氏距离就有非常明确的空间距离概念。马氏距离有消除量纲影响的作用。 (2)要综合考虑对样本观测数据的预处理和将要采用的聚类分析方法。如在进行聚类分析之前已经对变量作了标准化处理,则通常就可采用欧氏距离。 (3)要考虑研究对象的特点和计算量的大小。样品间距离公式的选择是一个比较复杂且带有一定主观性的问题,我们应根据研究对象的特点不同做出具体分折。实际中,聚类分析前不妨试探性地多选择几个距离公式分别进行聚类,然后对聚类分析的结果进行对比分析,以确定最合适的距离测度方法。
2022-05-30 17:59:57 605KB 聚类分析
1
之前的博文使用pyspark.mllib.recommendation做推荐案例,代码实现了如何为用户做电影推荐和为电影找到潜在的感兴趣用户。本篇博文介绍如何利用因子分解出的用户特征、电影特征做用户和电影的聚类分析,以看能否找到不同于已知的、有趣的新信息。 第一步:获取用户评分数据显式因式分解后的movieFactors、userFactors。 from pyspark.mllib.recommendation import ALS,Rating #用户评分数据 rawData = sc.textFile("/Users/gao/data/ml-100k/u.data") rawRatin
2022-05-27 21:19:39 268KB ar ark 聚类
1
蚁群算法在聚类分析中的应用.doc
2022-05-27 14:08:05 170KB 算法 文档资料
各城市劳动力竞争力的谱系聚类分析,林婉虹,周文龙,劳动力竞争力指标评价体系主要包括劳动力队伍、劳动力投入、劳动力产出和劳动力环境四个方面的要素。在劳动力素质、劳动力科研投
2022-05-25 13:52:20 326KB 首发论文
1
上机作业 已知十个样本,每个样本2个特征,数据如下: 用K次平均算法和ISODATA算法分成3类,编程上机,并画出分类图。 样本序号 1 2 3 4 5 6 7 8 9 10 x1 0 1 2 4 5 5 6 1 1 1 x2 0 1 1 3 3 4 5 4 5 6
2022-05-23 02:55:23 375KB matlab
1
% 使用高斯分布(正态分布) % 随机生成3个中心以及标准差 s = rng(5,'v5normal'); mu = round((rand(3,2)-0.5)*19)+1; sigma = round(rand(3,2)*40)/10+1; X = [mvnrnd(mu(1,:),sigma(1,:),200); ... mvnrnd(mu(2,:),sigma(2,:),300); ... mvnrnd(mu(3,:),sigma(3,:),400)];
2022-05-21 11:48:30 337KB matlab 聚类分析 自己编写
1
DBSCAN_matlab Matlab中DBSCAN聚类分析算法的实现
2022-05-20 22:12:21 2KB MATLAB
1
利用 Matlab 和 SPSS 软件实现聚类分析(9页).pdf
2022-05-19 09:10:00 255KB matlab 源码软件 开发语言
聚类分析及其在图像处理上的应用.pdf
2022-05-19 09:01:06 589KB 图像处理 人工智能 资料