大数据技术分享 Hadoop技术分享 Hadoop在反作弊中的应用 案例分享:应用MR计算用户相似度 共31页.pdf
2022-06-09 13:08:06 7.46MB hadoop 大数据 mr
大数据技术分享 Hadoop技术分享 基于Hadoop的阿里搜索计算平台 共21页.pdf
2022-06-09 13:08:05 1.06MB hadoop
ZooKeeper是Hadoop的正式子项目,它是一个针对大型分布式系统的可靠协调系统,提供的功能包括:配置维护、名字服务、分布式同步、组服务等。ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。 那么Zookeeper能帮我们作什么事情呢?简单的例子:假设我们我们有个20个搜索引擎的服务器(每个负责总索引中的一部分的搜索任务)和一个 总服务器(负责向这20个搜索引擎的服务器发出搜索请求并合并结果集),一个备用的总服务器(负责当总服务器宕机时替换总服务器),一个web的cgi(向总服务器发出搜索请求)。搜索引擎的服务器中的15个服务器现在提供搜索服务,5个服务器正在生成索引。这20个搜索引擎的服务器经常要让正在 提供搜索服务的服务器停止提供服务开始生成索引,或生成索引的服务器已经把索引生成完成可以搜索提供服务了。使用Zookeeper可以保证总服务器自动感知有多少提供搜索引擎的服务器并向这些服务器发出搜索请求,备用的总服务器宕机时自动启用备用的总服务器,web的cgi能够自动地获知总服务器的网络地址变化。
2022-06-08 22:05:57 4.41MB zookeeper zookeeper hadoop
lg大数据高薪训练营 HBase、 Java9 、Java10 、MySQL优化 、JVM原理 、JUC多线程、 CDH版Hadoop Impala、 Flume 、Sqoop、 Azkaban、 Oozie、 HUE、 Kettle、 Kylin 、Spark 、Mllib机器学习、 Flink、 Python、 SpringBoot、 Hadoop3.x新特性、 ClickHouse、 Kudu、 Presto 、Druid、 Ambari 、DataX、 Logstash 、Kibanna、 数据结构 Scala · Scala基础入门 · 函数式编程 · 数据结构 · 面向对象编程 · 模式匹配 · 高阶函数 · 特质 · 注解&类型参数 · 隐式转换 · 高级类型 · 案例实操 Spark Core · 安装部署 · RDD概述 · 编程模型 · 持久化&检查点机制 · DAG · 算子详解 · RDD编程进阶 · 累加器&广播变量 Spark SQL · SparkSQL · DataFrame · DataSet · 自定义
2022-06-08 19:10:43 161B 大数据
1
基于Hadoop的交通信息物理系统交通诱导方法研究
2022-06-08 19:10:37 2.3MB hadoop 交通物流
课程分享——Impala大数据分析引擎,完整版视频课程下载。 课程介绍 Impala由Cloudera公司主导开发的大数据实时查询分析工具,宣称比原来基于MapReduce的HiveSQL查询速度提升3~90倍,且更加灵活易用。提供类SQL的查询语句,能够查询存储在Hadoop的HDFS、Kudu、HBase(实际生产环境中不用)中的PB级大数据。查询速度快是其最大的卖点。简言之impala作为大数据实时查询分析工具,具有查询速度快,灵活性高,易整合,可伸缩性强等特点。 但是在一些实时性要求很高的场景中,一方面满足实时性要求,一方面提升用户体验。Impala因其快速的响应能力当之无愧作为首选查询分析工具。
2022-06-08 15:06:29 727B 数据分析 impala hadoop
1
一个基于Hadoop平台进行的单词统计系统,其中包含了伪分布架构,并且包含HDFS数据存储,结合Java后台利用Mapreduce架包进行单词的统计与分析。包含了完整的实践过程,内涵源代码,以及实验命令,内容丰富,实验过程完整。指令明确,图文并茂,且配有对于每一个关键步骤的详细解释,对于新手及其友好。并且对于搭建过程中所会产生的问题,进行了详细的解释。内附Madreduce和程序整体的运行流程,过程清晰明了。
1
hadoop.dll、winutils.exe等windows配置hadoop所需bin文件
2022-06-07 16:30:12 719KB hadoop
1
较全面的Hbase与hadoop分析报告.doc,很好的HADOOP报告
2022-06-07 15:35:21 305KB 较全面的Hbase与hadoop分析报告.doc
1
星环Slipstream使用方法,基于星环大数据平台的Slipstream,了解Slipstream的基本功能和使用,内部培训文档
2022-06-07 14:58:54 478KB 大数据 hadoop 星环 Slipstream流处理过程
1