目录:网盘文件永久链接 000 大数据学习要求-王艳芝 001 大数据行业与技术趋势-李申浩 002 Fusion Insight HD解决方案介绍-李申浩 003 HDFS技术原理01-李申浩 004 HDFS技术原理02-李申浩 005 大数据平台架构和集成设计-王艳芝 006 HDFS技术原理01-王艳芝 007 HDFS技术原理02-王艳芝 008 MapReduce-王艳芝 009 第一周作业答疑-王艳芝 010 MapReduces和YARN介绍-王艳芝 011 YANR01-王艳芝 012 YARN02-王艳芝 013 Streaming技术原理-王艳芝 014 YARN架构和应用运行原理和Streaming架构和应用运行原理-王艳芝 015 Spark技术原理01-王艳芝 016 Spark技术原理02-王艳芝 017 HBase技术原理01-王艳芝 018 第二周作业答疑-王艳芝 019 HBase技术原理02-王艳芝 020 HBase技术原理03和Hive技术原理-王艳芝 021 Flume、Loader、Kafka技术原理-王艳芝 022 Fusion Insight HD学习总结与扯家常-王艳芝 023 数据挖掘概述预备知识-李申浩 024 数据挖掘基本知识术语+数据预处理简单算法-李申浩 025 数据预处理简单算法+分类-李申浩 026 分类+离群点检测-李申浩 027 关联规则和分类-李申浩 028 分类-李申浩 029 聚类-李申浩 030 聚类和数据仓库介绍-李申浩 031 分类算法应用场景实例1-李申浩 032 分类算法应用场景实例2-李申浩 033 分类算法应用场景实例3-李申浩 034 分类算法应用场景实例4-李申浩
2021-10-09 14:03:51 322B HCIE BigData 华为
目录:网盘文件永久链接 1.1.1 大数据的定义及其应用领域 1.2.1 大数据时代的机遇与挑战 2.1.1 HDFS的概述和架构 2.2.1 关键特性介绍 (1) 2.2.2 HDFS关键特性介绍 (2) 3.1.1 MapReduce和Yarn基本介绍-MapReduce和Yarn功能与架构 3.2.1 YARN的功能与架构 3.3.1 YARN的资源管理和特性介绍 4.1.1 Spark概述及核心Spark Core# 4.2.1 Spark体系结构梳理 5.1.1 Hbase的功能和架构 5.2.1 Hbase的关键流程和特性 6.1.1 Hive的概述和架构 6.2.1 Hive功能与架构-Hive基本操作 7.1.1 Streaming的概述和架构 7.2.1 Streaming特性和StreamCQL介绍 8.1.1 Flink概述-Flink原理与技术架构 8.2.1 Flink的底层原理和集成情况 9.1.1 Loader数据转换 10.1.1 Flume的关键流程和特性 10.2.1 Flume操作实例 11.1.1 Kafka分布式消息订阅系统 12.1.1 ZooKeeper集群分布式协调服务 13.1.1 FusionInsight HD 解决方案介绍 (1) 13.2.1 FusionInsight HD 解决方案介绍 (2
2021-10-09 14:03:48 377B HCIA BigData 华为
华为大数据认证HCIP BigData,HCIP-Big Data Developer V2.0 题库,H13-723
2021-10-04 11:11:32 205KB 大数据BigData HCIPh13-723题库
1
天池_大数据 阿里天池大数据竞赛—全国社会保险大数据应用创新大赛原始码(2017/09/18)
2021-10-04 10:41:44 5.42MB 系统开源
1
目录:网盘文件,永久连接 1_分布式数据库概述 2_ FusionInsight LibrA 简介 3_FusionInsight LibrA 产品特性和关键技术 4.1_ FusionInsight LibrA 配套工具集_part1 4.2_FusionInsight LibrA 配套工具集_part2 4.3_FusionInsight LibrA 配套工具集_part3 5_FusionInsight LibrA 安全管理 6_FusionInsight LibrA 数据库管理系统并发控制 7_FusionInsight LibrA 数据库性能监控 8.1_FusionInsight LibrA 数据迁移_part1 8.2_FusionInsight LibrA 数据迁移_part2 9_FusionInsight LibrA SQL介绍(刘吉 20171201) 10.1_FusionInsight LibrA 数据库设计_part1 10.2_FusionInsight LibrA 数据库设计_part2 11_FusionInsight LibrA 应用程序开发指导 12.1_预备知识和数据介绍_数据挖掘的定义 12.2_预备知识和数据介绍_数据挖掘的流程 12.3_预备知识和数据介绍_数据挖掘的应用 12.4.1_预备知识和数据介绍_数据和属性类型_part1 12.4.2_预备知识和数据介绍_数据和属性类型_part2 12.4.3_预备知识和数据介绍_数据和属性类型_part3 12.5_预备知识和数据介绍_数据的统计描述 12.6.1_预备知识和数据介绍_数据的邻近性度量_part1 12.6.2_预备知识和数据介绍_数据的邻近性度量_part2 13.1_数据预处理_为什么要预处理数据 13.2_数据预处理_数据清理 13.3_数据预处理_数据集成 13.4_数据预处理_数据归约 13.5_数据预处理_数据变换 14.1_数据仓库介绍_数据仓库的概念 14.2_数据仓库介绍_数据仓库的体系结构与模型 14.3_数据仓库介绍_多维数据模型 14.4_数据仓库介绍_概念分层 14.5.1_数据仓库介绍_OLAP与OLTP_part1 14.5.2_数据仓库介绍_OLAP与OLTP_part2 14.6_数据仓库介绍_方体物化 15.1_分类(Classification)_分类与回归的概念 15.2.1_分类(Classification)_决策树_part1 15.2.2_分类(Classification)_决策树_part2 15.3_分类(Classification)_朴素贝叶斯分类 15.4_分类(Classification)_组合分类 15.5_分类(Classification)_后向传播分类 15.6_分类(Classification)_支持向量机分类 15.7_分类(Classification)_模型评估与类不平衡问题 16.1_聚类(Clustering)_聚类的定义与k-均值聚类 16.2_聚类(Clustering)_k-中心点聚类 17.1_离群点检测_离群点的定义 17.2_离群点检测_离群点的检测方法 18.1_关联规则(Associate Rule)_关联规则的定义与挖掘步骤 18.2_关联规则(Associate Rule)_关联规则挖掘方法分类与Apriori算法 19.1_FusionInsight Miner 和华为云机器学习服务MLS-1_FusionInsight Miner介绍 19.2_FusionInsight Miner 和华为云机器学习服务MLS-1_关系分析 19.3_FusionInsight Miner 和华为云机器学习服务MLS-1_标签管理 19.4_FusionInsight Miner 和华为云机器学习服务MLS-2 20.1_FusionInsight LibrA实验一 基本操作、语法_part1 20.2_FusionInsight LibrA实验一 基本操作、语法_part2 20.3_FusionInsight LibrA实验一 基本操作、语法_part3 20.4_FusionInsight LibrA实验一 基本操作、语法_part4 21.1_FusionInsight LibrA实验二 性能优化_part1 21.2_FusionInsight LibrA实验二 性能优化_part2 22.1_FusionInsight LibrA 实验三 网络KPI数据栅格化处理_part1 ........
2021-09-29 18:05:57 398B HCIE BigData 华为
目录: 第一章 大数据行业与技术趋势 1.1_大数据时代 1.2_大数据的应用领域-华为大数据解决方案 第二章 HDFS分布式文件系统 2.1_HDFS概述及应用场景-HDFS系统架构 2.2_关键特性介绍 第三章 MapReduce分布式离线批处理和Yarn资源协调 3.1_MapReduce和Yarn基本介绍-MapReduce和Yarn功能与架构 3.2_Yarn的资源管理和任务调度-增强特性 第四章 Spark2x基于内存的分布式计算 4.1_Spark概述-Spark原理与架构 4.2_Spark原理与架构-Spark在FusionInsight中的集成情况 第五章 HBase分布式NoSQL数据库 5.1_HBase基本介绍 5.2_HBase功能与架构 5.3_HBase关键流程-HBase华为增强特性 第六章 Hive分布式数据仓库 6.1_Hive概述-Hive功能与架构 6.2_Hive功能与架构-Hive基本操作 第七章 Streaming分布式流计算引擎 7.1_Streaming简介-系统架构 7.2_关键特性介绍-StreamCQL介绍 第八章 Flink流计算处理和批处理平台 8.1_Flink概述-Flink原理与技术架构 8.2_Flink原理与技术架构-Flink在FusionInsight HD中的集成情况 第九章 Loader数据转换 9.1_Loader简介-Loader作业管理 第十章 Flume海量日志聚合 10.1_Flume简介及架构-Flume应用举例 第十一章 Kafka分布式消息订阅系统 11.1_Kafka简介-Kafka架构与功能 11.2_Kafka架构与功能-Kafka关键流程 第十二章 ZooKeeper集群分布式协调服务 12.1_ZooKeeper简介-与组件的关系 第十三章 FusionInsight HD 解决方案介绍 13.1_FusionInsight概述-FusionInsight特性介绍 13.2_FusionInsight HD 成功案例
2021-09-29 18:03:45 387.18MB 华为 HCIA BigData
musescore-数据集 musescore.com 上所有乐谱和用户的非官方数据集,致力于大数据分析/数据科学/机器学习。 所有数据都是通过迭代来收集的。 jsonl文件采用 ( ) 格式。 学习音乐只需要乐谱文件? 试试 。 在 Google BigQuery 中 用户数据 手动更新, 最后更新:2020 年 11 月 9 日 乐谱元数据 每天美国东部时间上午 7:10 更新(UTC-5 / UTC-4 夏令时) 所有mscz文件 每天美国东部时间上午 7:10 更新(UTC-5 / UTC-4 夏令时) # The CSV file itself is on IPFS ipns= " QmSdXtvzC8v8iTTZuj5cVmiugnzbR1QATYRcGix4bBsioP " cid= $( curl https://ipfs.io/api/v0/dag/resolv
2021-09-28 19:40:25 2KB bigdata dataset
1
搜狗五百万数据,是经过处理后的搜狗搜索引擎生产数据,具有真实性,大数据性,能够较好的满足分布式计算应用开发课程设计的数据要求。
2021-09-06 20:44:50 97.75MB bigdata log
1
数据产品经理必修课。也算是顺应时代需要的一本书。开卷有益。
2021-09-06 18:36:50 13.41MB bigdata
1
LUBM数据集,大概包括十几种谓词,一共有大约三十多万条RDF三元组 。
2021-08-24 11:49:33 50.67MB LUBM bigdata
1