搜索【spark 】的结果

简单的spark 读写hive以及mysql

简单的spark加载HIVE MYSQL 数据，以及简单的进行往mysql,hive写入数据

2022-06-22 09:18:55 3KB spark hive m

1

web-Google.txt.gz

谷歌图谱数据集，适合spark进行图计算 # Directed graph (each unordered pair of nodes is saved once): web-Google.txt # Webgraph from the Google programming contest, 2002 # Nodes: 875713 Edges: 5105039 # FromNodeId ToNodeId

2022-06-21 16:04:24 20.19MB spark google

1

基于Spark图计算的社会网络分析系统.zip

资源包含文件：课程论文word+项目源码本文在 Spark 及图计算引擎 GraphX 的基础上，设计并实现一套用于顶点分析的社交网络分析系统，为使用 Spark 进行大规模社交网络的顶点分析提供具体接口，包括社交网络的图模型构建、顶点重要度估值、顶点间路径的计算、顶点分组等接口，并对计算结果进行了一定程度上的可视化展现。主要工作包括两个方面:第一是构建图和数据可视化的实现;第二是具体的顶点分析接口的实现。详细介绍参考：https://biyezuopin.blog.csdn.net/article/details/124983932

2022-06-21 09:11:23 9.42MB Spark 图计算 GraphX 社会网络分析系统

spark: RDD与DataFrame之间的相互转换方法

DataFrame是一个组织成命名列的数据集。它在概念上等同于关系数据库中的表或R/Python中的数据框架，但其经过了优化。DataFrames可以从各种各样的源构建，例如：结构化数据文件，Hive中的表，外部数据库或现有RDD。 DataFrame API 可以被Scala，Java，Python和R调用。在Scala和Java中，DataFrame由Rows的数据集表示。在Scala API中，DataFrame只是一个类型别名Dataset[Row]。而在Java API中，用户需要Dataset用来表示DataFrame。在本文档中，我们经常将Scala/Java数据

2022-06-19 22:28:20 56KB ar ark dataframe

1

Apache Spark中的决策树

2022-06-19 14:01:02 26KB apache

Spark推荐系统源码.zip

Spark 推荐系统技术栈数据处理 Spark Core + Spark SQL + MongoDB 离线推荐静态数据处理：Spark Core + Spark SQL 推荐服务：Spark Core + Spark MLlib 在线推荐获取消息服务：Redis + Kafka 推荐服务：Spark Streaming 数据集格式商品数据集（Product）字段名类型描述说明 _id 自动生成 productId int 商品 id name String 商品名称 imageUrl String 商品图片 categories String 商品分类由 | 分隔评分数据集（Rating）字段名类型描述说明 _id 自动生成 userId int 用户 id productId int 商品 id score double 用户评分 timestamp int 评分时的时间戳用户数据集（User）字段名类型描述说明 _id 自动生成 userId int 用户 id username String 用户账号 pas

2022-06-19 09:09:31 587KB spark scala

最新spark+hadoop+hive+zookeeper(下)-hive-spark-zookeeper

apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle

2022-06-17 22:05:55 581.01MB hive spark zk

1

最新spark+hadoop+hive+zookeeper(上)-hadoop-3.3.3

apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle

2022-06-17 22:05:54 502.74MB hadoop

1

Spark+ES+ClickHouse 构建DMP用户画像

Spark+ES+ClickHouse 构建DMP用户画像（共8章+源码+文档资料+视频免密，2.84GB），供大家参考学习，目录结构：第1章DMP用户画像项目介绍（4个文件）第2章项目环境搭建（14个文件）第3章DMP和用户画像（7个文件）第4章用户画像搭建之特征工程（16个文件）第5章用户画像搭建之标签体系构建（11个文件）第6章用户画像搭建之群体用户画像构建（12个文件）第7章用户画像搭建之DMP人群管理（12个文件）第8章项目展示及版本升级解决方案（4个文件）源码（64个文件）资料代码（90个文件）

2022-06-17 19:08:04 138B spark es clickhouse

最新spark+hadoop+hive+zookeeper(中)-mysql

apache-hive-3.1.3-bin.tar.gz apache-zookeeper-3.5.10-bin.tar.gz hadoop-3.3.3.tar.gz spark-3.2.1-bin-hadoop3.2.tgz mysql-8.0.29-1.el8.x86_64.rpm-bundle

2022-06-17 19:04:43 751.65MB myslq8

1

个人信息

热门下载

最新下载

其他资源