hive自定义函数demo
2022-05-30 14:05:56 98KB hive 源码软件 hadoop 数据仓库
1
使用时配合https://blog.csdn.net/qq_43431735/category_9653567.html这个专栏使用,将三个sh文件添加权限,chmon +x 文件名,三个文件放在一个目录下,同时可以将目录路径添加到环境变量,这样在Linux那个位置都可以使用文件。 通过测试,hdfs与yarn组件启动后有以下进程: node1 jps:4个进程 NameNode、JournalNode、DFSZKFailoverController、Jps node2 jps:7个进程 DFSZKFailoverController、NodeManager、JournalNode、QuorumPeerMain、DataNode、Jps、NameNode node3 jps:6个进程 ResourceManager、DataNode、QuorumPeerMain、JournalNode、Jps、NodeManager node4 jps:5个进程 NodeManager、DataNode、QuorumPeerMain、ResourceManager、Jps
2022-05-29 19:06:16 1KB hdfs javascript hadoop big
1
hadoop伪分布式搭建.docx
2022-05-29 19:00:37 702KB 分布式 hadoop 文档资料 大数据
flink 1.14.3集成hadoop 3.2.3的jar包,flink启动yarn session时需要将该jar放到flink的lib目录下
2022-05-29 14:06:01 56.45MB jar flink hadoop java
1
apache-hive的安装与配置
2022-05-29 14:05:57 892.33MB hive apache 综合资源 hadoop
1
Hadoop 下单词反向索引程序实验报告.pdf
2022-05-29 14:05:52 887KB hadoop 文档资料 大数据 big
Hadoop中winutils2.6.1-3.2.2
2022-05-29 14:05:51 2.42MB hadoop 大数据 big data
1
针对Hadoop集群部署过程繁琐复杂、耗时费力、运维难度大,且不利于快速扩展的问题,提出一种结合Docker容器技术部署集群的解决方法。该方法把Ambari及其运行环境和配置构建成Docker镜像,并把多节点容器的运行和Hadoop集群的部署过程写成Shell脚本,只需一条命令,即可实现集群的自动化部署。实验结果表明,该方法简单可靠并极大地提高了集群部署的效率。因此,对海量数据的处理和分析具有重要的推动作用。
2022-05-29 11:09:07 722KB 工程技术 论文
1
Apache Hadoophadoop-3.3.3-src.tar.gz)项目为可靠、可扩展的分布式计算开发开源软件。 Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,因此在计算机集群之上提供高可用性服务,每台计算机都可能容易出现故障。
2022-05-29 10:05:02 33.98MB ApacheHadoop hadoop
Apache Hadoophadoop-3.2.3-src.tar.gz)项目为可靠、可扩展的分布式计算开发开源软件。 Apache Hadoop 软件库是一个框架,它允许使用简单的编程模型跨计算机集群分布式处理大型数据集。它旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。库本身不是依靠硬件来提供高可用性,而是设计用于检测和处理应用层的故障,因此在计算机集群之上提供高可用性服务,每台计算机都可能容易出现故障。
2022-05-29 10:05:01 31.61MB ApacheHadoop hadoop