一、首先搭建hadoop环境 https://blog.csdn.net/jiuweiC/article/details/104414651 二、安装scala 命令行执行:brew install scala 执行完成后,终端输入:scala -version 进行查看,如下表明安装成功: scala -version Scala code runner version 2.12.8 -- Copyright 2002-2018, LAMP/EPFL and Lightbend, Inc. 然后在环境变量中增加scala相关的变量,命令行输入:vim ~/etc/profile进行编辑,
2022-12-05 13:49:04 695KB ar ark c
1
大数据环境下如何架构实时推荐系统的说明文档,使用了目前流行的spark hbase kafa sparkstream ml spray ...等技术。
2022-12-03 21:39:25 3.34MB 大数据 实时推荐 spark
1
46488_Spark大数据技术与应用_习题数据和答案.rar
2022-11-30 20:18:38 120.37MB
1
Spark-Terasort TeraSort是一种流行的基准测试,用于衡量在给定群集上对1 TB随机分布的数据(或所需的任何其他数据量)进行排序的时间。 它最初是用来测量Apache:trade_mark:Hadoop:registered:集群的MapReduce性能的。 在此项目中,代码将在Scala中重写,以测量Spark集群的性能。 它是对Hadoop集群的存储层(HDFS)和计算层(YARN / Spark)进行组合测试的基准。 完整的TeraSort基准测试运行包含以下三个步骤: 通过TeraGen生成输入数据。 在输入数据上运行实际的TeraSort。 通过TeraValidate验证排序的输出数据。 您无需在每次TeraSort运行之前重新生成输入数据(步骤2)。 因此,如果对生成的数据感到满意,则可以跳过第1步(TeraGen),以便以后的TeraSort运行。 包装方式 $ sbt assembly
2022-11-27 02:17:40 24KB Java
1
spark-2.1.1-bin-hadoop2.6.tgz
2022-11-26 14:25:28 189.59MB spark 大数据
1
spark 3.3.1 使用 cdh 6.3.2 的hadoop版本。可以直接兼容并配合文档进行cdh spark-sql的使用。 具体查看https://editor.csdn.net/md/?articleId=127997188
2022-11-23 14:26:55 254.24MB spark
1
分享一套Spark+ClickHouse大数据课程——《Spark+ClickHouse实战企业级数据仓库,进军大厂必备》,课程一共19章,提供源码+软件下载! 《Spark+ClickHouse实战企业级数据仓库,进军大厂必备》课程结合ClickHouse+Spark 这一对数据处理的“黄金搭档”,选取“大数据量企业数据仓库“这一典型场景,实战大数据量下数仓的建模、设计与调优等实用技巧,快速掌握ClickHouse+Spark核心技能,为晋级大数据架构师铺路!课程结合热门技术,实战企业级数仓项目,轻松掌握高薪数据工程师必备技能。课程通过更贴近生产实践的案例,掌握多种实用方案,满足复杂业务需求。课程遵照数仓分层模型,实战数据处理的各个环节,构建实用技术体系。
2022-11-23 09:23:27 1KB ClickHouse Spark
1
大数据~有关于RDD编程初级实践的学习报告 小丸子帮大家总结到位了 希望可以帮助各位 点赞收藏哈!!!
2022-11-22 14:03:17 2.37MB 大数据 spark 操作系统 RDD编程
1
分享大数据课程——Spark+ClickHouse实战企业级数据仓库,进军大厂必备(最新版19章),提供课程配套的源码下载
2022-11-20 19:21:19 232B Spark ClickHouse
1
分享课程——Spark+ClickHouse实战企业级数据仓库,进军大厂必备,Spark3.2+ClickHouse22.3,19章完整版视频课程下载。 本课程结合ClickHouse+Spark 这一对数据处理的“黄金搭档”,选取“大数据量企业数据仓库“这一典型场景,实战大数据量下数仓的建模、设计与调优等实用技巧,快速掌握ClickHouse+Spark核心技能,为晋级大数据架构师铺路!
2022-11-20 19:21:18 592B Spark ClickHouse 数据仓库
1