Spark官方文档整理.pdf
2022-06-10 09:09:30 6.87MB spark
core-site.xml常用配置文件模板: fs.defaultFS hdfs://c101:8020 hadoop.tmp.dir /data hadoop.http.staticuser.user root hadoop.security.authorization false
2022-06-09 22:09:53 628B hadoop
1
PageRank_MapReduce 在 Hadoop 上运行的 MapReduce 程序
2022-06-09 21:34:33 3KB Java
1
【目录】 简介 数据模型 业务设计 产品线使用建议 监控 总结
2022-06-09 19:04:43 1.25MB hadoop 大数据 hbase
大数据技术分享 Hadoop技术分享 360超大规模HBase集群的改进 共43页.pdf
2022-06-09 14:05:43 1.51MB hadoop 大数据 hbase
大数据技术分享 Hadoop技术分享 淘宝HBase技术 共14页.pptx
2022-06-09 14:05:42 170KB hadoop 大数据 hbase
大数据技术分享 Hadoop技术分享 Hadoop在反作弊中的应用 案例分享:应用MR计算用户相似度 共31页.pdf
2022-06-09 13:08:06 7.46MB hadoop 大数据 mr
大数据技术分享 Hadoop技术分享 基于Hadoop的阿里搜索计算平台 共21页.pdf
2022-06-09 13:08:05 1.06MB hadoop
ZooKeeper是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。 那么Zookeeper能帮我们作什么事情呢?简单的例子:假设我们我们有个20个搜索引擎的服务器(每个负责总索引中的一部分的搜索任务)和一个 总服务器(负责向这20个搜索引擎的服务器发出搜索请求并合并结果集),一个备用的总服务器(负责当总服务器宕机时替换总服务器),一个web的cgi(向总服务器发出搜索请求)。搜索引擎的服务器中的15个服务器现在提供搜索服务,5个服务器正在生成索引。这20个搜索引擎的服务器经常要让正在 提供搜索服务的服务器停止提供服务开始生成索引,或生成索引的服务器已经把索引生成完成可以搜索提供服务了。使用Zookeeper可以保证总服务器自动感知有多少提供搜索引擎的服务器并向这些服务器发出搜索请求,备用的总服务器宕机时自动启用备用的总服务器,web的cgi能够自动地获知总服务器的网络地址变化。
2022-06-08 22:05:57 4.41MB zookeeper zookeeper hadoop
lg大数据高薪训练营 HBase、 Java9 、Java10 、MySQL优化 、JVM原理 、JUC多线程、 CDH版Hadoop Impala、 Flume 、Sqoop、 Azkaban、 Oozie、 HUE、 Kettle、 Kylin 、Spark 、Mllib机器学习、 Flink、 Python、 SpringBoot、 Hadoop3.x新特性、 ClickHouse、 Kudu、 Presto 、Druid、 Ambari 、DataX、 Logstash 、Kibanna、 数据结构 Scala · Scala基础入门 · 函数式编程 · 数据结构 · 面向对象编程 · 模式匹配 · 高阶函数 · 特质 · 注解&类型参数 · 隐式转换 · 高级类型 · 案例实操 Spark Core · 安装部署 · RDD概述 · 编程模型 · 持久化&检查点机制 · DAG · 算子详解 · RDD编程进阶 · 累加器&广播变量 Spark SQL · SparkSQL · DataFrame · DataSet · 自定义
2022-06-08 19:10:43 161B 大数据
1