搜索【bigData】的结果

目录：网盘文件永久链接 1 大数据概述（挺重要的） 2 hdfs01 3 hdfs02 4 mapreduce 5 yarn 6 streaming 7 spark 8 hbase(上) 9 hbase(下) 10 安装部署

2021-10-09 14:03:54 349B HCIA BigData 华为

目录：网盘文件永久链接 000 大数据学习要求-王艳芝 001 大数据行业与技术趋势-李申浩 002 Fusion Insight HD解决方案介绍-李申浩 003 HDFS技术原理01-李申浩 004 HDFS技术原理02-李申浩 005 大数据平台架构和集成设计-王艳芝 006 HDFS技术原理01-王艳芝 007 HDFS技术原理02-王艳芝 008 MapReduce-王艳芝 009 第一周作业答疑-王艳芝 010 MapReduces和YARN介绍-王艳芝 011 YANR01-王艳芝 012 YARN02-王艳芝 013 Streaming技术原理-王艳芝 014 YARN架构和应用运行原理和Streaming架构和应用运行原理-王艳芝 015 Spark技术原理01-王艳芝 016 Spark技术原理02-王艳芝 017 HBase技术原理01-王艳芝 018 第二周作业答疑-王艳芝 019 HBase技术原理02-王艳芝 020 HBase技术原理03和Hive技术原理-王艳芝 021 Flume、Loader、Kafka技术原理-王艳芝 022 Fusion Insight HD学习总结与扯家常-王艳芝 023 数据挖掘概述预备知识-李申浩 024 数据挖掘基本知识术语+数据预处理简单算法-李申浩 025 数据预处理简单算法+分类-李申浩 026 分类+离群点检测-李申浩 027 关联规则和分类-李申浩 028 分类-李申浩 029 聚类-李申浩 030 聚类和数据仓库介绍-李申浩 031 分类算法应用场景实例1-李申浩 032 分类算法应用场景实例2-李申浩 033 分类算法应用场景实例3-李申浩 034 分类算法应用场景实例4-李申浩

2021-10-09 14:03:51 322B HCIE BigData 华为

华为HCIA-Big Data V2.0 LVC公开课培训视频教程【共25集】.rar

目录：网盘文件永久链接 1.1.1 大数据的定义及其应用领域 1.2.1 大数据时代的机遇与挑战 2.1.1 HDFS的概述和架构 2.2.1 关键特性介绍（1） 2.2.2 HDFS关键特性介绍（2） 3.1.1 MapReduce和Yarn基本介绍-MapReduce和Yarn功能与架构 3.2.1 YARN的功能与架构 3.3.1 YARN的资源管理和特性介绍 4.1.1 Spark概述及核心Spark Core# 4.2.1 Spark体系结构梳理 5.1.1 Hbase的功能和架构 5.2.1 Hbase的关键流程和特性 6.1.1 Hive的概述和架构 6.2.1 Hive功能与架构-Hive基本操作 7.1.1 Streaming的概述和架构 7.2.1 Streaming特性和StreamCQL介绍 8.1.1 Flink概述-Flink原理与技术架构 8.2.1 Flink的底层原理和集成情况 9.1.1 Loader数据转换 10.1.1 Flume的关键流程和特性 10.2.1 Flume操作实例 11.1.1 Kafka分布式消息订阅系统 12.1.1 ZooKeeper集群分布式协调服务 13.1.1 FusionInsight HD 解决方案介绍 (1) 13.2.1 FusionInsight HD 解决方案介绍 (2

2021-10-09 14:03:48 377B HCIA BigData 华为

HCIP-Big Data Developer V2.0.pdf

华为大数据认证HCIP BigData，HCIP-Big Data Developer V2.0 题库,H13-723

2021-10-04 11:11:32 205KB 大数据BigData HCIPh13-723题库

1

TianChi_BigData:阿里天池大数据竞赛—全国社会保险大数据应用创新大赛原始码（20170918）-源码

天池_大数据阿里天池大数据竞赛—全国社会保险大数据应用创新大赛原始码（2017/09/18）

2021-10-04 10:41:44 5.42MB 系统开源

1

华为HCIE-Big Data V1.0 LVC公开课培训视频教程汇总集【共73集】.rar

目录：网盘文件，永久连接 1_分布式数据库概述 2_ FusionInsight LibrA 简介 3_FusionInsight LibrA 产品特性和关键技术 4.1_ FusionInsight LibrA 配套工具集_part1 4.2_FusionInsight LibrA 配套工具集_part2 4.3_FusionInsight LibrA 配套工具集_part3 5_FusionInsight LibrA 安全管理 6_FusionInsight LibrA 数据库管理系统并发控制 7_FusionInsight LibrA 数据库性能监控 8.1_FusionInsight LibrA 数据迁移_part1 8.2_FusionInsight LibrA 数据迁移_part2 9_FusionInsight LibrA SQL介绍（刘吉 20171201） 10.1_FusionInsight LibrA 数据库设计_part1 10.2_FusionInsight LibrA 数据库设计_part2 11_FusionInsight LibrA 应用程序开发指导 12.1_预备知识和数据介绍_数据挖掘的定义 12.2_预备知识和数据介绍_数据挖掘的流程 12.3_预备知识和数据介绍_数据挖掘的应用 12.4.1_预备知识和数据介绍_数据和属性类型_part1 12.4.2_预备知识和数据介绍_数据和属性类型_part2 12.4.3_预备知识和数据介绍_数据和属性类型_part3 12.5_预备知识和数据介绍_数据的统计描述 12.6.1_预备知识和数据介绍_数据的邻近性度量_part1 12.6.2_预备知识和数据介绍_数据的邻近性度量_part2 13.1_数据预处理_为什么要预处理数据 13.2_数据预处理_数据清理 13.3_数据预处理_数据集成 13.4_数据预处理_数据归约 13.5_数据预处理_数据变换 14.1_数据仓库介绍_数据仓库的概念 14.2_数据仓库介绍_数据仓库的体系结构与模型 14.3_数据仓库介绍_多维数据模型 14.4_数据仓库介绍_概念分层 14.5.1_数据仓库介绍_OLAP与OLTP_part1 14.5.2_数据仓库介绍_OLAP与OLTP_part2 14.6_数据仓库介绍_方体物化 15.1_分类（Classification）_分类与回归的概念 15.2.1_分类（Classification）_决策树_part1 15.2.2_分类（Classification）_决策树_part2 15.3_分类（Classification）_朴素贝叶斯分类 15.4_分类（Classification）_组合分类 15.5_分类（Classification）_后向传播分类 15.6_分类（Classification）_支持向量机分类 15.7_分类（Classification）_模型评估与类不平衡问题 16.1_聚类（Clustering）_聚类的定义与k-均值聚类 16.2_聚类（Clustering）_k-中心点聚类 17.1_离群点检测_离群点的定义 17.2_离群点检测_离群点的检测方法 18.1_关联规则（Associate Rule）_关联规则的定义与挖掘步骤 18.2_关联规则（Associate Rule）_关联规则挖掘方法分类与Apriori算法 19.1_FusionInsight Miner 和华为云机器学习服务MLS-1_FusionInsight Miner介绍 19.2_FusionInsight Miner 和华为云机器学习服务MLS-1_关系分析 19.3_FusionInsight Miner 和华为云机器学习服务MLS-1_标签管理 19.4_FusionInsight Miner 和华为云机器学习服务MLS-2 20.1_FusionInsight LibrA实验一基本操作、语法_part1 20.2_FusionInsight LibrA实验一基本操作、语法_part2 20.3_FusionInsight LibrA实验一基本操作、语法_part3 20.4_FusionInsight LibrA实验一基本操作、语法_part4 21.1_FusionInsight LibrA实验二性能优化_part1 21.2_FusionInsight LibrA实验二性能优化_part2 22.1_FusionInsight LibrA 实验三网络KPI数据栅格化处理_part1 ........

2021-09-29 18:05:57 398B HCIE BigData 华为

华为HCIA-Big Data V2.0 LVC公开课培训.rar

目录：第一章大数据行业与技术趋势 1.1_大数据时代 1.2_大数据的应用领域-华为大数据解决方案第二章 HDFS分布式文件系统 2.1_HDFS概述及应用场景-HDFS系统架构 2.2_关键特性介绍第三章 MapReduce分布式离线批处理和Yarn资源协调 3.1_MapReduce和Yarn基本介绍-MapReduce和Yarn功能与架构 3.2_Yarn的资源管理和任务调度-增强特性第四章 Spark2x基于内存的分布式计算 4.1_Spark概述-Spark原理与架构 4.2_Spark原理与架构-Spark在FusionInsight中的集成情况第五章 HBase分布式NoSQL数据库 5.1_HBase基本介绍 5.2_HBase功能与架构 5.3_HBase关键流程-HBase华为增强特性第六章 Hive分布式数据仓库 6.1_Hive概述-Hive功能与架构 6.2_Hive功能与架构-Hive基本操作第七章 Streaming分布式流计算引擎 7.1_Streaming简介-系统架构 7.2_关键特性介绍-StreamCQL介绍第八章 Flink流计算处理和批处理平台 8.1_Flink概述-Flink原理与技术架构 8.2_Flink原理与技术架构-Flink在FusionInsight HD中的集成情况第九章 Loader数据转换 9.1_Loader简介-Loader作业管理第十章 Flume海量日志聚合 10.1_Flume简介及架构-Flume应用举例第十一章 Kafka分布式消息订阅系统 11.1_Kafka简介-Kafka架构与功能 11.2_Kafka架构与功能-Kafka关键流程第十二章 ZooKeeper集群分布式协调服务 12.1_ZooKeeper简介-与组件的关系第十三章 FusionInsight HD 解决方案介绍 13.1_FusionInsight概述-FusionInsight特性介绍 13.2_FusionInsight HD 成功案例

2021-09-29 18:03:45 387.18MB 华为 HCIA BigData

musescore-dataset:musescore.com 上所有乐谱和用户的数据集-源码

musescore-数据集 musescore.com 上所有乐谱和用户的非官方数据集，致力于大数据分析/数据科学/机器学习。所有数据都是通过迭代来收集的。 jsonl文件采用 ( ) 格式。学习音乐只需要乐谱文件？试试。在 Google BigQuery 中用户数据手动更新，最后更新：2020 年 11 月 9 日乐谱元数据每天美国东部时间上午 7:10 更新（UTC-5 / UTC-4 夏令时）所有mscz文件每天美国东部时间上午 7:10 更新（UTC-5 / UTC-4 夏令时） # The CSV file itself is on IPFS ipns= " QmSdXtvzC8v8iTTZuj5cVmiugnzbR1QATYRcGix4bBsioP " cid= $( curl https://ipfs.io/api/v0/dag/resolv

2021-09-28 19:40:25 2KB bigdata dataset

1

搜狗五百万用户搜索日志记录

搜狗五百万数据，是经过处理后的搜狗搜索引擎生产数据，具有真实性，大数据性，能够较好的满足分布式计算应用开发课程设计的数据要求。

2021-09-06 20:44:50 97.75MB bigdata log

1

数据产品经理必修课

数据产品经理必修课。也算是顺应时代需要的一本书。开卷有益。

2021-09-06 18:36:50 13.41MB bigdata

1

个人信息

热门下载

最新下载

其他资源