Spark in Action 英文无水印原版pdf pdf所有页面使用FoxitReader、PDF-XChangeViewer、SumatraPDF和Firefox测试都可以打开 本资源转载自网络,如有侵权,请联系上传者或csdn删除 查看此书详细信息请在美国亚马逊官网搜索此书
2022-07-18 17:23:18 8.85MB Spark Action
1
1、实验环境: 设备名称 LAPTOP-9KJS8HO6 处理器 Intel(R) Core(TM) i5-10300H CPU @ 2.50GHz 2.50 GHz 机带 RAM 16.0 GB (15.8 GB 可用) 主机操作系统 Windows 10 家庭中文版 虚拟机操作系统 ubuntukylin-16.04 Hadoop 版本 3.1.3 JDK 版本 1.8 Java IDE:Eclipse 系统类型 64 位操作系统, 基于 x64 的处理器 笔和触控 没有可用于此显示器的笔或触控输入 2、实验内容与完成情况: 1. 安装hadoop和spark。 将下载好的安装包解压至固定路径并安装 使用命令./bin/spark-shell启动spark 图2启动spark 2. Spark读取文件系统的数据 (1) 在spark-shell中读取Linux系统本地文件“/home/hadoop/test.txt”,然后统计出文件的行数; 图3 spark统计行数 (2) 在spark-shell中读取HDFS系统文件“/user/hadoop/test.txt”(
2022-07-15 19:05:43 1.9MB 大数据 spark hadoop
1
Spark 入门实战系列,适合初学者,文档包括十部分内容,质量很好,为了感谢文档作者,也为了帮助更多的人入门,传播作者的心血,特此友情转贴: 1.Spark及其生态圈简介.pdf 2.Spark编译与部署(上)--基础环境搭建.pdf 2.Spark编译与部署(下)--Spark编译安装.pdf 2.Spark编译与部署(中)--Hadoop编译安装.pdf 3.Spark编程模型(上)--概念及SparkShell实战.pdf 3.Spark编程模型(下)--IDEA搭建及实战.pdf 4.Spark运行架构.pdf 5.Hive(上)--Hive介绍及部署.pdf 5.Hive(下)--Hive实战.pdf 6.SparkSQL(上)--SparkSQL简介.pdf 6.SparkSQL(下)--Spark实战应用.pdf 6.SparkSQL(中)--深入了解运行计划及调优.pdf 7.SparkStreaming(上)--SparkStreaming原理介绍.pdf 7.SparkStreaming(下)--SparkStreaming实战.pdf 8.SparkMLlib(上)--机器学习及SparkMLlib简介.pdf 8.SparkMLlib(下)--SparkMLlib实战.pdf 9.SparkGraphX介绍及实例.pdf 10.分布式内存文件系统Tachyon介绍及安装部署.pdf
2022-07-14 17:45:38 32.05MB Spark 实战 案例
1
使用hive,hadoop,spark,datax,python,scala修改添加的配置
2022-07-13 18:10:42 4KB hive hadoop spark
1
dolphinscheduler使用hive,hadoop,spark,datax,python,scala修改添加的配置
2022-07-13 18:10:37 5KB DolphinScheduler hadoop spark hive
1
使用hive,hadoop,spark修改添加的配置
2022-07-13 18:10:36 17KB hadoop spark hive
1
使用hive,hadoop,spark,datax,python,scala修改添加的配置
2022-07-13 18:10:33 9KB spark hive hadoop
1
人工智能-推荐系统-电影推荐-基于Spark ML实现的豆瓣电影推荐系统
2022-07-08 21:07:34 6.23MB 推荐系统 推荐算法 电影推荐
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。Spark是UC Berkeley AMP lab (加州大学伯克利分校的AMP实验室)所开源的类Hadoop MapReduce的通用并行框架,Spark,拥有Hadoop MapReduce所具有的优点;但不同于MapReduce的是——Job中间输出结果可以保存在内存中,从而不再需要读写HDFS,因此Spark能更好地适用于数据挖掘与机器学习等需要迭代的MapReduce的算法。
2022-07-08 14:09:14 23.88MB spark apache spark
1
当前形式的 Spark Core 的开发始于 2013 年 1 月在中国深圳,当时 Spark 参与了 HAXLR8R 硬件加速器。Spark Cloud 的开发始于 2011 年 12 月,作为支持 Spark Socket 的软件基础设施。2013 年 1 月至 5 月期间,Spark Core 和 Cloud 从原型开发为用于构建互联网连接硬件的功能平台。2013 年 5 月 2 日,Spark Core 在众筹平台 Kickstarter 上推出。2013 年 5 月 17 日,该产品的硬件设计文件在 GitHub 上发布,供其他人使用和学习。 包括什么 BOM — Spark Core 最新版本的当前材料清单。包括来自设计文件、组件值、数量和封装类型的零件编号标签。 数据表— Spark 内核中包含的各种组件的数据表,包括 STM32F103CBT6 微控制器和 CC3000 Wi-Fi 模块。 EAGLE — Spark 核心的原理图和电路板文件。我们使用 EAGLE,一个免费增值的 PCB 设计软件包 更多详情、使用方法,请下载后阅读README.md文件
2022-07-06 19:10:11 17.13MB 设计 eagle 硬件