由于上传文件限制,把文件拆为两个。这是第一个文件。两个文件下载到同一个目录,解压缩后文件名: apache-hive-3.1.2-bin.tar.gz.a 改为 apache-hive-3.1.2-bin.tar.gz apache-hive-3.1.2-bin.tar.gz.zip 1/2
2022-06-04 23:51:31 115.9MB hive hadoop nosq 大数据
1
Hadoop简单应用案例,包括MapReduce、单词统计、HDFS基本操作、web日志分析、Zookeeper基本使用、Hive简单操作等
2022-06-04 14:06:44 30MB hadoop 文档资料 hive zookeeper
随机森林 这是 Spark 上随机森林算法的分布式实现。 这与 mllib 中可用的相同算法的实现不同。 在 mllib 中,随机森林算法是通过明智地拆分数据实例来实现的。 此实现是通过明智地拆分数据特征。 这种实现对于具有许多特征的数据非常有用。 我也做了一些即兴创作,删除了一些在这种实现方法中可以避免的类。 一个重要的改进是:现在,randomForest 的用户不需要提供 categoricalFeatureInfo(关于哪些是连续特征,一个分类特征包含多少类别的信息)作为输入。它现在被转换为一个 Option 这个实现会自动检测哪些是连续特征连续特征以及当 categoricalFeatureInfo 在用户输入中被指定为 None 时,分类特征包含多少个类别。
2022-06-04 03:47:54 1.02MB Scala
1
sql for hive 常用的sql使用
2022-06-03 19:07:25 30KB hive sql hadoop 数据仓库
1
Spark streaming应用运行7天之后,自动退出,日志显示token for xxx(用户名): HDFS_DELEGATION_TOKEN owner=xxxx@xxxx.com, renewer=yarn, realUser=, issueDate=1581323654722, maxDate=1581928454722, sequenceNumber=6445344, masterKeyId=1583) is expired, current time: 2020-02-17 16:37:40,567+0800 expected renewal time: 2020-02-17
2022-06-03 18:57:25 37KB apache ar ark
1
概念 MapReduce是hadoop分布式计算框架。 MapReduce意味着在计算过程中实际分为两大步,Map过程和Reduce过程。 下面以一个统计单词次数简单案例为例: 数据源 Map类 import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; // 案例:统计每一个单词出现的次数 // KEYIN - 这一行的偏移量 --- // VALUEIN
2022-06-03 10:18:20 214KB c ce do
1
hadoop搭建环境所需要的文档手册,步骤详细 包括相关的依赖包和jdk,适合初学者小白。 也可以通过私信联系我,半价安装
2022-06-03 09:08:27 530.53MB hadoop 文档资料 大数据 big
基于html与JavaScript使用spark和MongoDB的商品推荐系统设计与实现
2022-06-03 09:08:25 7.1MB mongodb javascript html spark
org.apache.flink flink-shaded-hadoop-2-uber 2.8.3-9.0 provided
2022-06-02 18:07:17 41.45MB flink hadoop big data
1
The first lock consists of a panel filled with sparkling aems:diamondsrubies.emeraldsand so onBeside the panel is a row of buttonsone corresponding to each type of gem.To unlock the doorLin must press the button corresponding to the most common type of gem in the panel.Note that if there is a tie between the most common type of gem(iethere are equal numbers)then more than one button will need to be pressed.Your task is to write a function first lock(gems) that determines which button(s)should b
2022-06-02 14:03:48 355B python spark 综合资源 开发语言