目录: 第一章 AVA通讲 第二章 HDFS技术原理 第三章 MapReduce技术原理 第四章 MySQL介绍 数据库基础 Hive数据存储 第五章 HBase技术原理 第六章 Loader使用 第七章 Flume技术原理 第八章 Kafka技术原理 第九章 Zookeeper技术原理 第十章 Streaming技术原理 第十一章 大数据离线批量数据处理场景化解决方案 第十二章 实时流处理场化解决方案 第十三章 大数据实时检索场景化解决方案
2022-07-02 14:06:51 322B HCIP Big-data
基于知乎数据,进行简单数据处理,包含读取数据、数据预处理(数据去重、数据去重、缺省值处理、数据分组)等处理
2022-07-02 10:54:36 2.26MB jupyter ide python big
1
一本详细讲解kudu,impala和spark的原著
2022-07-01 18:07:27 54.3MB spark
1
本项目主要是对一些常用的算法的实现,以及基于spark的机器学习算法实现。 目前以实现的功能有: * 数据预处理 * 基于spark的LR逻辑回归分类 * 基于spark的DT决策树分类
2022-06-29 19:09:40 10.66MB spark big data Scala
该项目是大三下学期的课程设计,使用的数据集来自知名数据网站 Kaggle 的 tmdb-movie-metadata 电影数据集,以Python为编程语言,使用大数据框架Spark对数据进行了预处理,然后分别从多个方面对数据进行了分类和分析,并对分析结果进行可视化。里面包含我的课程设计报告和完整的代码。希望对你们有帮助。
2022-06-24 19:07:37 3.43MB python big data spark
该项目是大三下学期的课程设计,选取了共541909条数据,以Python为编程语言,使用大数据框架Spark对数据进行了预处理,然后分别从多个方面对数据进行了分类和分析,并对分析结果进行可视化。里面包含我的课程设计报告和完整的代码。希望对你们有帮助。
2022-06-24 14:06:56 9.03MB python big data spark
大数据-算法-改进的径向基三维插值算法的研究与应用.pdf
2022-06-17 10:34:00 2.79MB 算法 big data 数据结构
虚拟机装苹果,0成本体验最新MacOS,实战VMware安装Big Sur 11.3。
2022-06-14 19:00:55 12.89MB 虚拟机装苹果,0成本体验最新Ma
big sur安装完美启动hd3000显卡驱动
2022-06-12 20:17:05 42.77MB hd hd000
1
数据需要自己去爬取,然后写到DB里面
2022-06-09 09:45:33 33.7MB 源码软件 big data 人工智能
1