集合Maven,hdfs,mapreduce等相关所有jar包及依赖包
2022-06-15 19:20:53 29.37MB hadoop jar
1
毕业前期,找工作时整理的大数据试题,带有部分面试题。 内容概要:包含单选160道、多选54道、判断86道、简答38道、大赛题目及源码1套、期末试卷(空白)1张。 文档格式:word,适用人群:大数据先关专业学生、老师、企业工作人员 适用场景:考前复习、面试题刷题、试卷出题。 试题部分均已按照顺序整理好,部分题目带有答案解析,整理不易,不喜勿喷,感谢支持!
本篇博客,Alice为大家带来关于如何搭建Spark的on yarn集群模式的教程。 文章目录准备工作cluster模式client模式[了解]两种模式的区别 官方文档: http://spark.apache.org/docs/latest/running-on-yarn.html 准备工作 安装启动Hadoop(需要使用HDFS和YARN,已经ok) 安装单机版Spark(已经ok) 注意:不需要集群,因为把Spark程序提交给YARN运行本质上是把字节码给YARN集群上的JVM运行,但是得有一个东西帮我去把任务提交上个YARN,所以需要一个单机版的Spark,里面的有spark-sh
2022-06-15 09:15:45 387KB ar ark hadoop
1
spark-2.4.6-cdh5.16.2
2022-06-14 19:08:04 258.06MB spark
1
spark相关jar包
2022-06-14 19:08:04 252.23MB spark
1
Hadoop培训讲义(3天课程),内容包括大数据概述、HBase、Hive、HDFS 、MapReduce等
2022-06-14 11:07:32 53.54MB Hadoop培训 HBase Hive HDFS
1
里面包含着所有的项目源码,图片资源和课程学习安排文档,我们可以根据每天浏览某网站的人数和访客量来判断该网站的好坏和受欢迎程度, 同时也可以根据外链的跳转率和访客或会员所用的浏览器等工具的分析来进行精准的广告推广,我们也可以根据地区的点击量和访客或是会员访问的时间的分析来进行合理的商品推广、精准推荐等操作
2022-06-14 11:06:40 7.25MB 大数据 hadoop 数据分析 实战项目
1
GP_connector jar 包
2022-06-13 18:06:52 3.52MB spark-data-trans
1
ImplaJDBC , 用于 Impala客户端链接代码。
2022-06-13 18:06:52 1.49MB spark-data-trans
1
在本篇文章,作者将讨论机器学习概念以及如何使用SparkMLlib来进行预测分析。后面将会使用一个例子展示SparkMLlib在机器学习领域的强悍。Spark机器学习API包含两个package:spark.mllib和spark.ml。spark.mllib包含基于弹性数据集(RDD)的原始Spark机器学习API。它提供的机器学习技术有:相关性、分类和回归、协同过滤、聚类和数据降维。spark.ml提供建立在DataFrame的机器学习API,DataFrame是SparkSQL的核心部分。这个包提供开发和管理机器学习管道的功能,可以用来进行特征提取、转换、选择器和机器学习算法,比如分类和
1