搜索【Spark】的结果

Python3：Python+spark编程实战

本文来自csdn，本文简单介绍了Python+spark的配置运行及实例介绍，希望对您的学习有所启迪。0.1配置可参考：0.2有关spark说明：spark不兼容Python3.6安装注意版本可下载：anaconda4.21.1数据student.txt1.2代码1.3结果展示2.1函数解析2.1.1collect()RDD的特性在进行基本RDD“转换”运算时不会立即执行，结果不会显示在显示屏中，collect（）是一个“动作”运算，会立刻执行，显示结果。2.1

2021-06-25 19:51:57 58KB Python3：Python+spark编程实战

1

学习scala好的项目

该scala项目时自己整理的，对初学者很有帮助，里面包含了scala各种技术

2021-06-25 10:20:01 19.2MB spark scala

1

深入理解Spark：核心思想及源码分析.pdf

深入理解Spark：核心思想及源码分析.pdf 深入理解Spark：核心思想及源码分析.pdf

2021-06-25 10:00:04 38.73MB Spark

1

springboot_spark.rar

基于springboot操作spark,实现sparkStreaming calculateTopTen

2021-06-24 21:01:34 74KB spark

1

深入理解Spark核心思想与源码分析

《深入理解Spark核心思想与源码分析》讲解了spark基本内容及源码分析

2021-06-24 16:51:28 40.77MB 大数据 spark 源码

1

Kyuubi：开源企业级Serverless Spark框架.pdf

姚琴 | 《Kyuubi：开源企业级Serverless Spark框架》@网易数帆技术沙龙议题：网易集团每日有数十万 Spark 类型的任务，这给服务端的运维及调优带来了巨大挑战。为支持业务避开底层技术和框架选型，直接享受到前沿技术，网易数帆开发了企业级 Serverless Spark 和数据湖探索框架Kyuubi，并将其开源。嘉宾：姚琴，网易数帆大数据专家，Apache Spark Committer / Apache Submarine Committer。

2021-06-24 14:05:51 4.75MB 大数据 Spark Kyuubi 开源

1

利用Intel Optane PMEM技术加速大数据分析.pdf

徐铖 | 《利用Intel Optane PMEM技术加速大数据分析》议题介绍：分享如何使用Intel开源项目Optimized Analytics Package (OAP)加速Spark、Flink的性能，介绍现有Spark框架在内存管理、Shuffle实现等层面性能有进一步提升的空间，以及如何更好利用新硬件，比如利用Intel Optane PMEM（持久化内存）技术上，Spark有诸多进一步优化的功能点。嘉宾简介：徐铖，Intel资深软件开发工程经理，现供职于Intel上海研发有限公司，现主要专注于大数据领域中基于英特尔平台技术进行优化。在这之前从事过Intel Hadoop发行版的核心开发以及相应大数据领域的社区工作，是Apache Commons/ORC/Hive的Committer也是Spark的Contributor，同时也是《持久内存架构与工程实践》的作者之一。

2021-06-24 14:05:50 2.32MB 大数据 spark Flink OptanePMEM

1

AutoAlgorithm.zip

2021-06-23 13:05:24 8.29MB spark

1

spark大数据案例

包含了Spark的一系列的小案例，包含core，sql，stream等案例

2021-06-23 12:53:41 63KB spark core sql stream

1

基于Spark的电影推荐系统，包含爬虫项目、web网站、后台管理系统以及spark推荐系统

2021-06-23 10:26:12 58.94MB 推荐系统

1

个人信息

热门下载

最新下载

其他资源