spark-2.3.4-bin-hadoop2.6.tgz
2023-04-05 09:11:45 214.42MB spark
1
项目名称 电影推荐系统——烂豆瓣 项目目标 打开电影网站,脑袋就开始发大,动作片,爱情片,科幻片,中国的,欧美的,日韩的,到底哪一部最合自己的口味?茫茫影海,想要找到自己的“真爱”,谈何容易?我们知道你们找得辛苦,所以我们为你量身推荐电影! 项目任务 任务 具体任务 负责人 工作量 数据集 负责完成收集电影、用户以及评分数据集,并对数据进行清洗,建立新的数据结构。建立并维护系统数据库。 推荐引擎 负责完成推荐系统,包括基于用户历史数据的离线推荐系统以及收集用户实时行为数据,进行精准的实时推荐。 API服务 负责完成基于烂豆瓣各产品,面向开发者的开放接口(API)服务。在这里,开发者可以接入烂豆瓣电影推荐的优质内容,以及基于各种兴趣的用户关系。 web应用 负责完成一个电影推荐web应用,利用开发接口API以及酷炫的web前端页面,实现用户与推荐系统的完美交互。 数据集 本系统所需要的电影数
2023-04-02 17:05:18 21.19MB movies kafka spark spark-streaming
1
基于Spark的电影推荐系统,python爬取数据并采用Django搭建系统(源码)内附详细说明文档,期末作业,毕业设计都可用。 系统架构的实现 系统的架构分为数据获取层,数据处理层,数据存储层,业务层,展示层。展示层包括了Web的前后台两部分,前台是为了用户来查看电影数据和推荐系统向用户展示推荐数据页面,后台是管理员管理用户和电影数据的页面。业务层是对前后台业务功能进行实现的代码逻辑层。 数据计算层是用来对数据做统计分析,和运行推荐算法的。通过对数据存储层里的基础数据和用户行为数据做计算推荐,得到的结果重新存入数据存储层中。 数据获取层用以获取本推荐系统所需要的大量基础数据,并进行数据预处理,使之规整以后便存入数据存储层中。
2023-04-02 16:46:08 10.52MB spark django java python
spark高可用集群(自动切换方式)搭建手册,spark高可用集群(自动切换方式)搭建手册
2023-03-29 13:59:09 324KB spark 高可用集群 部署
1
Linux下的spark安装包,Apache Spark是专为大规模数据处理而设计的快速通用的计算引擎 。现在形成一个高速发展应用广泛的生态系统。可和scala2.13.2兼容
2023-03-20 16:20:53 14.93MB spark-2.4.5
1
<数据算法--Hadoop-Spark大数据处理技巧>.Spark>.pdf全书686页,英文比中文容易理解 本资料共包含以下附件: 724f58d66ab6b3c4c6412e91117878cb.zip
2023-03-20 11:11:06 36.93MB 大数据 spark
1
spark-assembly-1.3.0-hadoop2.5.0-cdh5.3.0.jar的下载地址和提取码
2023-03-16 15:35:01 45B spark-sql hadoop spark-yarn
1
spark2.4.8编译支持 hadoop3.3.3 和 hive2
2023-03-08 21:08:34 219.89MB spark hadoop3
1
自己研究学习大数据spark 整合 spring , mybati,maven写的例子,自己测试没有问题了,分享一下,有问题请拍砖。
2023-03-07 19:29:30 22.94MB spring mybatis spark mysql
1
Spark中动态分区算法的设计与实现,阎逸飞,王智立,Spark是一种被广泛使用的分布式计算框架。在分布式环境中,一个重要且常见的问题是数据倾斜。为解决Spark shuffle过程中中间数据倾斜导
2023-03-06 18:25:19 480KB 计算机系统结构
1