文档非常详细,分为四个部分: ①VMware的安装 ②VMware下安装Ubuntu ③Hadoop的安装与配置 ④Spark的安装配置
2024-04-18 20:47:14 7.7MB spark hadoop vmware ubuntu
1
基于hadoop2.7.2,scala2.11的sparklinux软件包,解压到指定目录后即可使用,实测可行
2024-04-13 17:58:26 191.82MB spark
1
jar包引入命令:mvn install:install-file -DgroupId=com.cloudera -DartifactId=ImpalaJDBC41 -Dversion=2.6.3 -Dpackaging=jar -Dfile=./ImpalaJDBC41-2.6.3.jar DgroupId: pom.xml配置中groupId的值 DartifactId: pom.xml配置中artifactId的值 Dversion: 版本号 Dpackaging: 文件类型 Dfile: 文件路径
2024-03-30 18:02:49 13.04MB impala jdbc spark
1
计算机毕业设计Python+Spark游戏推荐系统 游戏可视化 游戏爬虫 游戏用户画像系统 游戏大屏可视化 游戏数据分析 游戏情感分析 神经网络混合CF推荐算法 大数据毕业设计 大数据毕设
2024-03-26 21:53:58 20.9MB
1
Spark的共享单车数据存储-Spark的共享单车数据存储系统-Spark的共享单车数据存储系统源码-Spark的共享单车数据存储管理系统-Spark的共享单车数据存储管理系统java代码-Spark的共享单车数据存储系统设计与实现-基于springboot的Spark的共享单车数据存储系统-基于Web的Spark的共享单车数据存储系统设计与实现-Spark的共享单车数据存储网站-Spark的共享单车数据存储网站代码-Spark的共享单车数据存储平台-Spark的共享单车数据存储平台代码-Spark的共享单车数据存储项目-Spark的共享单车数据存储项目代码-Spark的共享单车数据存储代码 1、技术栈:java,springboot,vue,ajax,maven,mysql,MyBatisPlus等 开发语言:Java 框架:SpringBoot JDK版本:JDK1.8 数据库:mysql 5.7 数据库工具:SQLyog/Navicat 开发软件:eclipse/myeclipse/idea Maven包:Maven 浏览器:谷歌浏览器 2、系统的实现 用户信息 图片素材 视频
2024-02-26 14:44:11 11MB spark 代码 springboot Java
1
藏经阁-GeoMesa on Spark SQL.pdf
2024-02-22 13:23:57 4.38MB
1
【项目资源】: 包含前端、后端、移动开发、操作系统、人工智能、物联网、信息化管理、数据库、硬件开发、大数据、课程资源、音视频、网站开发等各种技术项目的源码。 包括STM32、ESP8266、PHP、QT、Linux、iOS、C++、Java、python、web、C#、EDA、proteus、RTOS等项目的源码。 【项目质量】: 所有源码都经过严格测试,可以直接运行。 功能在确认正常工作后才上传。 【适用人群】: 适用于希望学习不同技术领域的小白或进阶学习者。 可作为毕设项目、课程设计、大作业、工程实训或初期项目立项。 【附加价值】: 项目具有较高的学习借鉴价值,也可直接拿来修改复刻。 对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】: 有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 鼓励下载和使用,并欢迎大家互相学习,共同进步。
2024-02-21 13:45:17 7.14MB 毕业设计 课程设计 项目开发 资源资料
1
【内容概要】 通过完整的气象监测数据处理与分析项目,了解Spark大数据分析的整体流程。代码涵盖数据工程、统计分析、机器学习预测建模等内容。可以学习如何使用Spark PySpark API处理大规模数据。 【适合人群】 具备一定Python编程基础,需要处理分析大规模数据的研发人员。 【能学到什么】 1. Spark数据处理:缺失值处理、降噪、特征工程等数据预处理技术 2. 统计分析:分组聚合、相关性分析、异常检测等统计方法 3. 机器学习:时间序列预测模型设计、集成学习提升效果 4. 微服务:模型API和Docker部署,提供后端服务 【学习建议】 项目代码完整覆盖了大数据分析全流程。在学习过程中,需要结合代码注释和文档,了解设计思路和背后的原理。同时调试并运行示例代码,加深理解。欢迎提出改进意见。
2024-01-14 11:43:06 1.02MB spark 数据分析
1
前 言 大数据学习路线 大数据技术栈思维导图 大数据常用软件安装指南 一、Hadoop 分布式文件存储系统:HDFS 分布式计算框架:MapReduce 集群资源管理器:YARN 单机伪集群环境搭建 集群环境搭建 常用 Shell 命令 Java API 的使用 基于 Zookeeper 搭建 Hadoop 高可用集群 二、Hive 简介及核心概念 Linux 环境下 Hive 的安装部署 CLI 和 Beeline 命令行的基本使用 常用 DDL 操作 分区表和分桶表 视图和索引 常用 DML 操作 数据查询详解 三、Spark Spark Core Spark SQL Spark Streaming 五、Flink 核心概念综述 开发环境搭建 Data Source Data Transformation Data Sink 窗口模型 状态管理与检查点机制 Standalone 集群部署 六、HBase 简介 系统架构及数据结构 基本环境搭建 集群环境搭建 常用 Shell 命令 Java API 过滤器详解 可显示字数有限,详细内容请看资源。
2023-12-20 09:06:41 20.75MB kafka kafka zookeeper zookeeper
1
1、25个经典Spark算子的JAVA实现。2、含有详细的注释。3、全部通过junit测试。
2023-11-24 07:02:50 42KB Spark算子 Java实现 Operation
1