Python数据挖掘 数据预处理案例(以航空公司数据为例)源代码+文件 完美解决复制代码后出现的空格问题,以及程序不能执行问题。
1
Mining Heterogeneous Information Networks: Principles and Methodologies. Synthesis Lectures on Data Mining and Knowledge Discovery
2022-12-19 16:57:28 2.36MB 数据挖掘
1
本书由Michigan State University 的Pang-Ning Tan和University of Minnesota的Michael Steinbach合著,深入浅出地说明了数据挖掘的四大部分:可视化、相关性分析、分类和聚集分析的概念和相关算法。本书同样也是斯坦福大学数据挖掘课程(Stats 202 Data Mining)的教学用书。本书为pdf英文版本,使用快压压缩。
2022-12-19 14:08:00 40.55MB 数据挖掘 Data Mining 网络
1
清晰完整扫描版数据挖掘导论,Introduction to Data Mining. Pang-Ning Tan
2022-12-17 08:43:49 49.3MB 数据挖掘
1
一、数据预处理与导入 1、2019_nCoV_data.csv是2020年1月-3月世界新冠疫情的数据,要求对2019_nCoV_data.csv进行数据预处理做以下操作,要求: (1)Sno编号列没有用,需要删除 部分国家对应的地区为NAN,需要填充为空白字符串 (3)部分国家/地区,受感染人数为0,也被列在表格中,需要删去 (4)查看受影响的国家/地区的数量,Country一列中将'Mainland China', 'Hong Kong' , 'Macau', 'Taiwan' 等统一修正为'China';另外需将'Korea, South'改为'South Korea'。 2、对于DXYArea.csv也需要进行数据预处理,要求做以下操作: (2)countryEnglishName一列中将 'HongKong' , 'Macao'等统一修正为'China'。 (3)将updateTime转换成date格式(输出为该数据的新列updateTime1,也就是只保留日期部分)。 (4)因为大部分城市都没有加“市”字,所以要把直辖市的下属区的“区”字去掉;还有一些没有变化规律的城市名
2022-12-16 21:50:44 944KB 可视化大屏
SDJU课程材料 前言 做这个库的初衷是将自己在课程结束后的一些方法和总结写下,希望前人所走的弯路,后来者无须再走。 毕竟是我个人所收集的课程资料,经常会有些遗漏,欢迎补充,欢迎贡献。 收录内容 选课攻略 电子版课件 实验报告 考试重点 复习资料 版权说明 本仓库分享资料是由我收集老师上课课件和实验内容。 资料来源网络,相关权利由原作者所有。 请内容创作者及公众监督,如有资料违反许可协议,请告知我改正错误。
2022-12-15 11:23:16 292.04MB 系统开源
1
数据挖掘中聚类的分析与研究,赵富,,聚类分析是数据挖掘中的一个重要研究领域。它将数据对象分组成为若干个类或簇,使得在同一个簇中的对象比较相似,而不同簇中的对
2022-12-14 19:25:34 198KB 数据挖掘
1
C++基于Qt的流数据分析与可视化软件源码。库 blitz - inline,无须单独编译 exprtkX KDDockWidgets kfr - inline,无须单独编译 libsndfile praat - inline,无须单独编译 QCustomPlot QtnProperty readerwriterqueue - inline,无须单独编译 rtaudio smarc 库 blitz - inline,无须单独编译 exprtkX KDDockWidgets kfr - inline,无须单独编译 libsndfile praat - inline,无须单独编译 QCustomPlot QtnProperty readerwriterqueue - inline,无须单独编译 rtaudio smarc
开放学术数据挖掘大赛测试数据集, json格式,包合论文元素据,摘要,标题,作者列表
2022-12-12 23:50:36 31.2MB nlp
1
适合初学者,R语言分析,医学处方 数据集
2022-12-10 13:26:10 4.03MB R医学分析 数据挖掘