1、大数据异构数据源-数据采集工具 2、DataX产品说明书
2022-04-13 13:04:52 560KB etl 数据仓库 数据采集 BigData
1
HCIP-Big Data Operation & Maintenance V1.0培训教材.zip
2022-04-12 14:03:38 87.19MB HCIP BigData
简历包含技能、项目经历描述等,非常具有学习参考价值。 1.Spark:能部署spark集群,能进行SparkCore、Spark SQL和Spark Streaming开发。理解Spark 内存管理。掌握spark任务提交和执行流程。擅长Spark调优。熟悉sparkRDD运行原理,掌握RDD算 子开发。 2.MapReduce:掌握了MapReduce运行原理机制,能对MapReduce框架开发及调优,能够搭建 Hadoop集,部署过CDH搭建Hadoop集群; 3.数据仓库:理解数据仓库设计原理,用HQL进行PB、TB级海量数据处理和开发,有Hive优化经验。 掌握Hive架构与原理、能搭建运维Hive架构及编写HQL代码;掌握Hive SQL数据类型、建表语法(内外表)、动态静态分区、内置函数自定义函数、分桶、hive视图索引、以及Hive优化等;
2022-04-06 14:07:47 3.43MB 大数据 简历 简历模板 bigdata
从三个案例,全面系统地阐述了大数据挖掘的整个过程 包括Jupyter Notebook的Python代码、数据集、和一些简单的解释说明。 教学课件
2022-03-19 19:37:53 3.03MB python bigdata
1
本书内容不错,从大数据的概念、数据采集、数据分析、实时数据处理、数据挖掘、深度学习、大数据可视化、大数据安全等各个方面都有涉及,最后还讲述了一些大公司的大数据架构,是一本了解大数据全链路不错的书籍。
2022-03-18 16:14:35 194.7MB bigdata
1
Hadoop: The Definitive Guide, 4th Edition Get ready to unlock the power of your data. With the fourth edition of this comprehensive guide, you’ll learn how to build and maintain reliable, scalable, distributed systems with Apache Hadoop. This book is ideal for programmers looking to analyze datasets of any size, and for administrators who want to set up and run Hadoop clusters. Using Hadoop 2 exclusively, author Tom White presents new chapters on YARN and several Hadoop-related projects such as Parquet, Flume, Crunch, and Spark. You’ll learn about recent changes to Hadoop, and explore new case studies on Hadoop’s role in healthcare systems and genomics data processing. Learn fundamental components such as MapReduce, HDFS, and YARN Explore MapReduce in depth, including steps for developing applications with it Set up and maintain a Hadoop cluster running HDFS and MapReduce on YARN Learn two data formats: Avro for data serialization and Parquet for nested data Use data ingestion tools such as Flume (for streaming data) and Sqoop (for bulk data transfer) Understand how high-level data processing tools like Pig, Hive, Crunch, and Spark work with Hadoop Learn the HBase distributed database and the ZooKeeper distributed configuration service
2022-03-11 02:30:11 8.38MB Bigdata
1
请注意:开发过程中master分支可能处于不稳定状态。 请在生产环境中使用我们的发行版。 什么是BBoxDB? BBoxDB是一个高度可用的分布式存储管理器,旨在处理多维大数据。 与现有的键值存储区相比,BBoxDB可以有效地处理多维。 现有的键值存储使用一维键来寻址值。 为多维数据找到合适的密钥具有挑战性,而且通常是不可能的。 当数据具有范围(非点数据/区域)时,尤其如此。 为了从键值存储中检索多维数据,通常需要进行完整的数据扫描。 开发BBoxDB是为了避免进行昂贵的完整数据扫描,并使多维数据的处理更加方便。 支持用户定义的过滤器来处理自定义数据格式,并且BBoxDB还支持数据流的处理。
2022-03-10 19:34:57 11.04MB sstables nosql storage-engine bigdata
1
华为认证HCIE Big Data认证培训资料 已解锁+无密码 真实理论+实验考题 想要考取华为HCIE Big Data认证的同学不容错过
2022-02-17 09:06:29 35.85MB 华为认证 HCIE BigData培训资料 已解锁
HCIE-Bigdata笔试,内容丰富
2022-02-14 14:09:37 363KB big data 大数据