2022-12-11 09:24:20 40KB 爬虫
1
通过HBase、Hive、MySQL和Python的联合使用,对弹幕数据进行了基础的分析,文章适合大数据的初学者用于提升和进一步系统地认识。
2022-12-10 22:24:22 5.63MB 数据分析 弹幕爬取 数据可视化 HBase
1
数据仓库Hive伪分布式部署与应用
2022-12-10 14:23:20 1.83MB hive Hadoop 数据仓库
1
数据仓库Hive伪分布式部署与应用
2022-12-10 14:23:19 1.11MB Hadoop hive编程 hive
1
基于Hadoop的全国酒店数据清洗项目源码+报告.zip结合本案例背景介绍,说明对本数据集进行分析的目的,说明采用的分析技术,实现的价值。 本案采用的数据集是全国各省市酒店的运营情况数据集,对该数据集进行分析的目的是为了更好的指导酒店行业的发展。本案例使用hdfs分布式存储系统存储数据,利用Hadoop的MapReduce技术进行数据分析。 3、简要介绍mapreduce框架 MapReduce是面向大数据并行处理的计算模型、框架和平台,它隐含了以下三层含义: (1)MapReduce是一个基于集群的高性能并行计算平台(Cluster Infrastructure)。它允许用市场上普通的商用服务器构成一个包含数十、数百至数千个节点的分布和并行计算集群。 基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip基于Hadoop的全国酒店数据清洗项目源码+报告.zip
牛客网招聘网站数据集爬取,用于大数据基础课程设计项目的统计分析。主要是利用招聘数据在Hadoop生态中进行导入、导出、统计分析、数据可视化。
2022-12-09 14:24:52 2.43MB Hadoop 牛客网招聘数据 大数据
1
Apache Atlas 内嵌式安装包
2022-12-06 22:22:20 794.49MB ApacheAtlas
1
内含交通数据和日志数据
2022-12-03 11:22:52 93.9MB Hadoop ubuntu
1
hadoop source code源代码归档
2022-12-03 11:22:52 193.13MB hadoop
1
该文件为hbase hbck2 jar;适用于hbase 2.x维护,hbase 1.x不适用; 对于HBase跨集群HD集群迁移,当HDFS文件迁移后,使用HBCK客户端,完成HBase元数据修复。 当前版本:hbase-hbck2-1.3.0.jar hbase hbck -j /opt/software/hbase-hbck2-1.3.0-SNAPSHOT.jar
2022-12-01 09:24:41 74.42MB hbase hbck
1
本系统主要设计完成两件工作,一是搭建分布式的hadoop的集群环境,二是基于分布式的集群环境做日志分析。详细介绍参考:https://blog.csdn.net/newlw/article/details/127332767
2022-11-30 14:25:46 1.25MB hadoop hive 数据处理 电影数据分析
对于初学者来说,非常靠谱的知识体系
2022-11-30 09:26:18 148KB big data flume
1
论文标准格式-更改页眉和封面
2022-11-29 14:27:26 66KB 格式
1
大数据Hadoop第八章hive
2022-11-28 21:22:17 7.07MB 大数据
1
拉勾网大数据相关职位数据
2022-11-26 16:23:25 34KB hadoop
1