springboot+echarts做大数据展示 scrapy数据采集 spark数据分析处理 包含java项目,数据采集项目,spark处理代码,数据库文件,数据源文件,项目演示截图等等
2024-06-21 20:25:20 71.21MB 数据采集
1
<数据算法--Hadoop-Spark大数据处理技巧>.pdf全书686页,英文比中文容易理解 本资料共包含以下附件: 724f58d66ab6b3c4c6412e91117878cb.zip
2023-03-20 11:11:06 36.93MB 大数据 spark
1
基于spark的电商用户行为分析系统源码+项目说明.zip 【环境】 spark 2.4.4 scala 2.11.8 hive 3.1.2 mysql 5.7.28 kafka_2.12-2.3.0 jdk 1.8.0_192 hadoop 2.9.2 zookeeper-3.5.5 Ubuntu 18.04 Windows10 Commons包:公共模块包 conf:配置工具类,获取commerce.properties文件中的所有配置信息, 使用户可以通过对象的方式访问commerce.properties中的所有配置 constant:常量接口,包括项目中所需要使用的所有常量 model: Spark SQL样例类,包括Spark SQL中的用户访问动作表、 用户信息表、产品表的样例类 pool:MySQL连接池,通过自定义MySQL连接池,实现对MySQL数据库 的操作 utils:工具类,提供了日期时间工具类、数字格式工具类、参数工具类、字符串工具类、校验工具类等工具类, 里面的类有: DateUtils:时间工具类,负责时间的格式化、判断时间先后、计算时间差值、获取指定日
基于spark大数据的音乐推荐大数据作业.zip基于spark编写的音乐推荐大数据作业,使用scala编程,使用python的flash框架作为可视化展示。 Audioscrobbler数据集有趣地方在于仅仅记录播放的历史:“某某某 播放了 什么”。一个播放记录带来的信息量远远小于一个评分数据带来的信息量,但是评分数据总量肯定没有播放历史记录的数据多,当大量播放历史记录放在一起的时候,比评分数据将更有价值。 主要的数据集是 user_artist_data.txt 文件,里面大约包含 141000 唯一的用户和 1.6 百万唯一的artist艺术家,大约 24.2 百万用户播放记录。 基于spark大数据的音乐推荐大数据作业.zip基于spark编写的音乐推荐大数据作业,使用scala编程,使用python的flash框架作为可视化展示。 Audioscrobbler数据集有趣地方在于仅仅记录播放的历史:“某某某 播放了 什么”。一个播放记录带来的信息量远远小于一个评分数据带来的信息量,但是评分数据总量肯定没有播放历史记录的数据多,当大量播放历史记录放在一起的时候,比评分数据将更有价
大数据期末课设~电商网站日志数据分析 主要利用spark和python结合分析实践具体案例 Word很全面 共有52页 可以直接作为期末课设上交
1
46488_Spark大数据技术与应用_习题数据和答案.rar
2022-11-30 20:18:38 120.37MB
1
spark-2.1.1-bin-hadoop2.6.tgz
2022-11-26 14:25:28 189.59MB spark 大数据
1
内容概要:由于cdh6.3.2的spark版本为2.4.0,并且spark-sql被阉割,现基于cdh6.3.2,scala2.12.0,java1.8,maven3.6.3,,对spark-3.2.2源码进行编译 应用:该资源可用于cdh6.3.2集群配置spark客户端,用于spark-sql
2022-10-20 19:07:22 254.33MB spark 大数据 cdh
1
Hadoop、Spark大数据入门、进阶电子书大全-附件资源
2022-07-30 22:02:48 23B
1
1、Spark中的HashShufle的有哪些不足 2、 conslidate是如何优化Hash shuffle时在map端产生的小文件 3、spark.def
2022-07-25 17:01:34 10KB spark 大数据
1