PageRank_MapReduce 在 Hadoop 上运行的 MapReduce 程序
2022-06-09 21:34:33 3KB Java
1
【目录】 简介 数据模型 业务设计 产品线使用建议 监控 总结
2022-06-09 19:04:43 1.25MB hadoop 大数据 hbase
大数据技术分享 Hadoop技术分享 360超大规模HBase集群的改进 共43页.pdf
2022-06-09 14:05:43 1.51MB hadoop 大数据 hbase
大数据技术分享 Hadoop技术分享 淘宝HBase技术 共14页.pptx
2022-06-09 14:05:42 170KB hadoop 大数据 hbase
大数据技术分享 Hadoop技术分享 Hadoop在反作弊中的应用 案例分享:应用MR计算用户相似度 共31页.pdf
2022-06-09 13:08:06 7.46MB hadoop 大数据 mr
大数据技术分享 Hadoop技术分享 基于Hadoop的阿里搜索计算平台 共21页.pdf
2022-06-09 13:08:05 1.06MB hadoop
ZooKeeper是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。 那么Zookeeper能帮我们作什么事情呢?简单的例子:假设我们我们有个20个搜索引擎的服务器(每个负责总索引中的一部分的搜索任务)和一个 总服务器(负责向这20个搜索引擎的服务器发出搜索请求并合并结果集),一个备用的总服务器(负责当总服务器宕机时替换总服务器),一个web的cgi(向总服务器发出搜索请求)。搜索引擎的服务器中的15个服务器现在提供搜索服务,5个服务器正在生成索引。这20个搜索引擎的服务器经常要让正在 提供搜索服务的服务器停止提供服务开始生成索引,或生成索引的服务器已经把索引生成完成可以搜索提供服务了。使用Zookeeper可以保证总服务器自动感知有多少提供搜索引擎的服务器并向这些服务器发出搜索请求,备用的总服务器宕机时自动启用备用的总服务器,web的cgi能够自动地获知总服务器的网络地址变化。
2022-06-08 22:05:57 4.41MB zookeeper zookeeper hadoop
lg大数据高薪训练营 HBase、 Java9 、Java10 、MySQL优化 、JVM原理 、JUC多线程、 CDH版Hadoop Impala、 Flume 、Sqoop、 Azkaban、 Oozie、 HUE、 Kettle、 Kylin 、Spark 、Mllib机器学习、 Flink、 Python、 SpringBoot、 Hadoop3.x新特性、 ClickHouse、 Kudu、 Presto 、Druid、 Ambari 、DataX、 Logstash 、Kibanna、 数据结构 Scala · Scala基础入门 · 函数式编程 · 数据结构 · 面向对象编程 · 模式匹配 · 高阶函数 · 特质 · 注解&类型参数 · 隐式转换 · 高级类型 · 案例实操 Spark Core · 安装部署 · RDD概述 · 编程模型 · 持久化&检查点机制 · DAG · 算子详解 · RDD编程进阶 · 累加器&广播变量 Spark SQL · SparkSQL · DataFrame · DataSet · 自定义
2022-06-08 19:10:43 161B 大数据
1
基于Hadoop的交通信息物理系统交通诱导方法研究
2022-06-08 19:10:37 2.3MB hadoop 交通物流
课程分享——Impala大数据分析引擎,完整版视频课程下载。 课程介绍 Impala由Cloudera公司主导开发的大数据实时查询分析工具,宣称比原来基于MapReduce的HiveSQL查询速度提升3~90倍,且更加灵活易用。提供类SQL的查询语句,能够查询存储在Hadoop的HDFS、Kudu、HBase(实际生产环境中不用)中的PB级大数据。查询速度快是其最大的卖点。简言之impala作为大数据实时查询分析工具,具有查询速度快,灵活性高,易整合,可伸缩性强等特点。 但是在一些实时性要求很高的场景中,一方面满足实时性要求,一方面提升用户体验。Impala因其快速的响应能力当之无愧作为首选查询分析工具。
2022-06-08 15:06:29 727B 数据分析 impala hadoop
1