第2章 RapidMiner Studio简介 RapidMiner Studio 结合技术性和适用性,为最新的及已建立的人性化数据挖掘技术提供服务。通过推拽算子,设置参数及组合算子,在RapidMiner Studio中定义分析流程。
2022-12-25 12:24:12 3.56MB 数据挖掘 大数据 Rapidminer
1
以jupyter为平台,利用python实现对墨尔本10年气候变化数据集的特征处理,然后并利用机器学习模型进行训练以及对原始数据集的拟合,最后来评价那种模型的拟合效果最佳。(提供了相关数据集)
1
使用两种算法来进行数据挖掘关联规则的分析,第一个是使用python自带的库函数,根据顾客实际购买行为数据(值为1表示购买了该种商品;值为0表示未购买该种商品),分析顾客在网络购物中购买图书、运动鞋、耳机、DVD和果汁五种商品时,是否存在购买行为上的关联,第二个是使用自定义算法来判断关联性并给出频繁项集。
2022-12-24 21:33:22 3KB 数据挖掘 关联规则
1
这是一个介绍社交网站数据挖掘与分析的教程,值得一看~
2022-12-24 15:32:54 6.31MB 社交网站 数据挖掘 分析
1
Python数据挖掘 数据预处理案例(以航空公司数据为例)源代码+文件 完美解决复制代码后出现的空格问题,以及程序不能执行问题。
1
Mining Heterogeneous Information Networks: Principles and Methodologies. Synthesis Lectures on Data Mining and Knowledge Discovery
2022-12-19 16:57:28 2.36MB 数据挖掘
1
本书由Michigan State University 的Pang-Ning Tan和University of Minnesota的Michael Steinbach合著,深入浅出地说明了数据挖掘的四大部分:可视化、相关性分析、分类和聚集分析的概念和相关算法。本书同样也是斯坦福大学数据挖掘课程(Stats 202 Data Mining)的教学用书。本书为pdf英文版本,使用快压压缩。
2022-12-19 14:08:00 40.55MB 数据挖掘 Data Mining 网络
1
清晰完整扫描版数据挖掘导论,Introduction to Data Mining. Pang-Ning Tan
2022-12-17 08:43:49 49.3MB 数据挖掘
1
一、数据预处理与导入 1、2019_nCoV_data.csv是2020年1月-3月世界新冠疫情的数据,要求对2019_nCoV_data.csv进行数据预处理做以下操作,要求: (1)Sno编号列没有用,需要删除 部分国家对应的地区为NAN,需要填充为空白字符串 (3)部分国家/地区,受感染人数为0,也被列在表格中,需要删去 (4)查看受影响的国家/地区的数量,Country一列中将'Mainland China', 'Hong Kong' , 'Macau', 'Taiwan' 等统一修正为'China';另外需将'Korea, South'改为'South Korea'。 2、对于DXYArea.csv也需要进行数据预处理,要求做以下操作: (2)countryEnglishName一列中将 'HongKong' , 'Macao'等统一修正为'China'。 (3)将updateTime转换成date格式(输出为该数据的新列updateTime1,也就是只保留日期部分)。 (4)因为大部分城市都没有加“市”字,所以要把直辖市的下属区的“区”字去掉;还有一些没有变化规律的城市名
2022-12-16 21:50:44 944KB 可视化大屏
SDJU课程材料 前言 做这个库的初衷是将自己在课程结束后的一些方法和总结写下,希望前人所走的弯路,后来者无须再走。 毕竟是我个人所收集的课程资料,经常会有些遗漏,欢迎补充,欢迎贡献。 收录内容 选课攻略 电子版课件 实验报告 考试重点 复习资料 版权说明 本仓库分享资料是由我收集老师上课课件和实验内容。 资料来源网络,相关权利由原作者所有。 请内容创作者及公众监督,如有资料违反许可协议,请告知我改正错误。
2022-12-15 11:23:16 292.04MB 系统开源
1