Data-Mining-Project-2014-
这个存储库包含我的学术课程“数据挖掘”项目的文件。 该项目涉及使用 K-Means 聚类算法进行聚类。
该项目的主要目的是了解聚类并应用 K-Means 聚类算法对数据进行聚类。 数据包括主要赛事的各种网球比赛的结果。 首先,我们应用特征减少来减少数据的字段,然后应用 K-Means 算法。
程序运行的先决条件是:
Hadoop 2.3.0
所有节点上的多节点集群设置
程序运行并相应地将数据集划分为 3 个集群:-
低获胜机会
中奖机会
高获胜机会
2023-04-02 20:44:04
55KB
Java
1