搜索【hadoop spark】的结果

最新spark+hadoop+hive+zookeeper(下)-hive-spark-zookeeper

apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle

2022-06-17 22:05:55 581.01MB hive spark zk

1

最新spark+hadoop+hive+zookeeper(上)-hadoop-3.3.3

apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle

2022-06-17 22:05:54 502.74MB hadoop

1

hadoop大数据课程设计

hadoop大数据课程设计，爬虫项目，python

2022-06-17 19:20:40 8KB hadoop 大数据 课程设计 python

1

Spark+ES+ClickHouse 构建DMP用户画像

Spark+ES+ClickHouse 构建DMP用户画像（共8章+源码+文档资料+视频免密，2.84GB），供大家参考学习，目录结构：第1章DMP用户画像项目介绍（4个文件）第2章项目环境搭建（14个文件）第3章DMP和用户画像（7个文件）第4章用户画像搭建之特征工程（16个文件）第5章用户画像搭建之标签体系构建（11个文件）第6章用户画像搭建之群体用户画像构建（12个文件）第7章用户画像搭建之DMP人群管理（12个文件）第8章项目展示及版本升级解决方案（4个文件）源码（64个文件）资料代码（90个文件）

2022-06-17 19:08:04 138B spark es clickhouse

最新spark+hadoop+hive+zookeeper(中)-mysql

apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle

2022-06-17 19:04:43 751.65MB myslq8

1

Hadoop集群的搭建

通过3台虚拟机搭建Hadoop集群的简单实验过程，希望可以帮到有需要的朋友。

2022-06-17 19:01:15 8.41MB Hadoop

1

Hadoop电影数据集，包含字段说明

2022-06-17 18:04:51 28KB hadoop 豆瓣

用-Hadoop-进行分布式数据处理

2022-06-17 14:09:12 903KB hadoop 大数据 分布式 数据处理

zookeeper的安装

ZooKeeper由雅虎研究院开发，是Google Chubby的开源实现，后来托管到Apache，于2010年11月正式成为Apache的顶级项目。 ZooKeeper是一个经典的分布式数据一致性解决方案，致力于为分布式应用提供一个高性能、高可用，且具有严格顺序访问控制能力的分布式协调服务。分布式应用程序可以基于ZooKeeper实现数据发布与订阅、负载均衡、命名服务、分布式协调与通知、集群管理、Leader选举、分布式锁、分布式队列等功能。在Zookeeper的官网上有这么一句话：ZooKeeper is a centralized service for maintaining configuration information, naming, providing distributed synchronization, and providing group services. 上传到文件里面有zookeeper的压缩包以及详细记录的zookeeper的安装过程，大家可以按照步骤一步一步的来进行安装。

2022-06-17 14:09:11 705KB Hadoop

1

Hadoop豆瓣电影分析可视化源码

针对本次实验，我们需要用到Hadoop集群作为模拟大数据的分析软件，集群环境必须要包括，hdfs，hbase，hive，flume，sqoop等插件，最后结合分析出来的数据进行可视化展示，需要用到Python（爬取数据集，可视化展示）或者echarts等可视化工具。豆瓣用户每天都在对“看过”的电影进行“很差”到“力荐”的评价，豆瓣根据每部影片看过的人数以及该影片所得的评价等综合数据，通过算法分析产生豆瓣电影 Top 250。为了分析电影产业的发展趋势，本次实验需要对这些信息做统计分析。注意：豆瓣网站的数据形式为文本文件（必须将导入到hive中做处理）。也可以为CSV文件，例如下图：

2022-06-17 09:10:53 14KB Hadoop豆瓣电影分析 Hadoop实验 hadoop 豆瓣电影分析

个人信息

热门下载

最新下载

其他资源