Apache Spark中的决策树
2022-06-19 14:01:02 26KB apache
Spark 推荐系统 技术栈 数据处理 Spark Core + Spark SQL + MongoDB 离线推荐 静态数据处理:Spark Core + Spark SQL 推荐服务:Spark Core + Spark MLlib 在线推荐 获取消息服务:Redis + Kafka 推荐服务:Spark Streaming 数据集格式 商品数据集(Product) 字段名 类型 描述 说明 _id 自动生成 productId int 商品 id name String 商品名称 imageUrl String 商品图片 categories String 商品分类 由 | 分隔 评分数据集(Rating) 字段名 类型 描述 说明 _id 自动生成 userId int 用户 id productId int 商品 id score double 用户评分 timestamp int 评分时的时间戳 用户数据集(User) 字段名 类型 描述 说明 _id 自动生成 userId int 用户 id username String 用户账号 pas
2022-06-19 09:09:31 587KB spark scala
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle
2022-06-17 22:05:55 581.01MB hive spark zk
1
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle
2022-06-17 22:05:54 502.74MB hadoop
1
Spark+ES+ClickHouse 构建DMP用户画像(共8章+源码+文档资料+视频免密,2.84GB),供大家参考学习,目录结构: 第1章DMP用户画像项目介绍(4个文件) 第2章项目环境搭建(14个文件) 第3章DMP和用户画像(7个文件) 第4章用户画像搭建之特征工程(16个文件) 第5章用户画像搭建之标签体系构建(11个文件) 第6章用户画像搭建之群体用户画像构建(12个文件) 第7章用户画像搭建之DMP人群管理(12个文件) 第8章项目展示及版本升级解决方案(4个文件) 源码(64个文件) 资料代码(90个文件)
2022-06-17 19:08:04 138B spark es clickhouse
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle
2022-06-17 19:04:43 751.65MB myslq8
1
本实验报告为厦门大学计算机科学系 林子雨 博士/助理教授《大数据处理技术Spark》课程在学期结束后的“大作业”。Spark课程实验案例:淘宝双11数据分析与预测课程案例,由厦门大学数据库实验室团队开发,旨在满足全国高校大数据教学对实验案例的迫切需求。本案例涉及数据预处理、存储、查询和可视化分析等数据处理全流程所涉及的各种典型操作,涵盖Linux、MySQL、Hadoop、Hive、Sqoop、Eclipse、ECharts、Spark等系统和软件的安装和使用方法。本报告含实验环境、实验内容、实验内容截图、遇到的问题及解决方案、心得体会。
2022-06-17 09:10:49 4.82MB 大数据 Spark Linux MySQL
博客文章: https://blog.csdn.net/lm19770429/article/details/124221123 https://blog.csdn.net/lm19770429/article/details/124981430
2022-06-16 09:08:45 18.91MB spark 大数据
1
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz
2022-06-15 21:05:10 623.38MB 大数据
1
apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz
2022-06-15 21:05:09 599.82MB 大数据
1