Data-Mining-Project-2014- 这个存储库包含我的学术课程“数据挖掘”项目的文件。 该项目涉及使用 K-Means 聚类算法进行聚类。 该项目的主要目的是了解聚类并应用 K-Means 聚类算法对数据进行聚类。 数据包括主要赛事的各种网球比赛的结果。 首先,我们应用特征减少来减少数据的字段,然后应用 K-Means 算法。 程序运行的先决条件是: Hadoop 2.3.0 所有节点上的多节点集群设置 程序运行并相应地将数据集划分为 3 个集群:- 低获胜机会 中奖机会 高获胜机会
2023-04-02 20:44:04 55KB Java
1
数据挖掘项目 推文聚类 目标: 主Twitter API用于提取推文 掌握自然语言处理 数据清理 推文分类 要求: Twitter开发人员帐户 Twitter API 1-数据提取: 导入库(tweepy +熊猫+ numpy) 连接到Twitter API 将推文提取到多个csv文件中,然后将它们组合到一个csv文件中 2-处理前的推文: 使用re库搜索不必要的信息。 删除标点符号,主题标签,个人资料名称,URL和表情符号。 创建一个新的干净的CSV文件 3-处理推文:自然语言处理 导入nltk(自然语言工具包),它由最常用的算法组成,例如标记化,词性标记,词干,情感分析,主题细分和命名实体识别。 NLTK帮助计算机分析,预处理和理解书面文本。 使用“停用词”摆脱英语单词,这些单词不会给句子增加太多含义。 在不牺牲含义的前提下,可以安全地忽略它们。 使用“ Porte
2022-08-31 21:34:30 1.86MB JupyterNotebook
1
.数据仓库与数据挖掘项目建设-精讲.pdf
2022-07-14 09:01:04 14.63MB 数据库 数据仓库 数据挖掘
机器学习
2022-05-28 08:29:23 250KB 数据挖掘
1
WineScorePredictor 预测葡萄酒品质的数据挖掘项目
2022-05-01 20:16:15 102KB JupyterNotebook
1
基于决策树的银行营销数据挖掘 ├── 0,数据挖掘基础知识精讲 │ ├── 工具 │ ├── 教案 │ ├── 案例 │ ├── 视频 │ └── 资料 ├── 1,项目背景与运行环境 ├── 2,IBM SPSS Modeler简介 ├── 3,GRISP-DM数据挖掘流程 ├── 4,决策树算法 ├── 5,建立银行用户挖掘模型 ├── 6,运行及结果分析 ├── 7,模型应用 └── 8,课程总结
2022-02-14 09:11:49 237.85MB 人工智能 项目实战 决策树 银行营销
关于金融行业商业智能项目案例分析,结合实际用户需求及案例,描述BI在金融行业的应用
2022-02-13 12:28:46 3.1MB 商业智能 BI 数据挖掘
1
参考使用,欢迎下载
2022-01-05 17:02:31 698KB Java
数据挖掘项目:Python
2021-12-26 18:19:32 4KB
1
数据挖掘项目源码
2021-12-14 12:04:17 18KB 数据挖掘
1