apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle
2022-06-17 22:05:55 581.01MB hive spark zk
1
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle
2022-06-17 22:05:54 502.74MB hadoop
1
hadoop大数据课程设计,爬虫项目,python
2022-06-17 19:20:40 8KB hadoop 大数据 课程设计 python
1
Spark+ES+ClickHouse 构建DMP用户画像(共8章+源码+文档资料+视频免密,2.84GB),供大家参考学习,目录结构: 第1章DMP用户画像项目介绍(4个文件) 第2章项目环境搭建(14个文件) 第3章DMP和用户画像(7个文件) 第4章用户画像搭建之特征工程(16个文件) 第5章用户画像搭建之标签体系构建(11个文件) 第6章用户画像搭建之群体用户画像构建(12个文件) 第7章用户画像搭建之DMP人群管理(12个文件) 第8章项目展示及版本升级解决方案(4个文件) 源码(64个文件) 资料代码(90个文件)
2022-06-17 19:08:04 138B spark es clickhouse
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle
2022-06-17 19:04:43 751.65MB myslq8
1
通过3台虚拟机搭建Hadoop集群的简单实验过程,希望可以帮到有需要的朋友。
2022-06-17 19:01:15 8.41MB Hadoop
1
Hadoop电影数据集,包含字段说明
2022-06-17 18:04:51 28KB hadoop 豆瓣
用-Hadoop-进行分布式数据处理
2022-06-17 14:09:12 903KB hadoop 大数据 分布式 数据处理
ZooKeeper由雅虎研究院开发,是Google Chubby的开源实现,后来托管到Apache,于2010年11月正式成为Apache的顶级项目。 ZooKeeper是一个经典的分布式数据一致性解决方案,致力于为分布式应用提供一个高性能、高可用,且具有严格顺序访问控制能力的分布式协调服务。 分布式应用程序可以基于ZooKeeper实现数据发布与订阅、负载均衡、命名服务、分布式协调与通知、集群管理、Leader选举、分布式锁、分布式队列等功能。 在Zookeeper的官网上有这么一句话:ZooKeeper is a centralized service for maintaining configuration information, naming, providing distributed synchronization, and providing group services. 上传到文件里面有zookeeper的压缩包以及详细记录的zookeeper的安装过程,大家可以按照步骤一步一步的来进行安装。
2022-06-17 14:09:11 705KB Hadoop
1
针对本次实验,我们需要用到Hadoop集群作为模拟大数据的分析软件,集群环境必须要包括,hdfs,hbase,hive,flume,sqoop等插件,最后结合分析出来的数据进行可视化展示,需要用到Python(爬取数据集,可视化展示)或者echarts等可视化工具。 豆瓣用户每天都在对“看过”的电影进行“很差”到“力荐”的评价,豆瓣根据每部影片看过的人数以及该影片所得的评价等综合数据,通过算法分析产生豆瓣电影 Top 250。 为了分析电影产业的发展趋势,本次实验需要对这些信息做统计分析。 注意:豆瓣网站的数据形式为文本文件(必须将导入到hive中做处理)。也可以为CSV文件,例如下图: