datax的clickhouse读写插件 由开源产品修复, 适用于clickhouse读写插件|同步mysql,sqlserver等数据到clickhose中或者反向同步
2022-04-28 11:47:05 18KB datax clickehouse
1
clickhouse入门-》高级-》监控备份
2022-04-27 18:04:59 3.36MB 文档资料
1
基于 Spark 的矩阵分解推荐算法
2022-04-27 13:37:49 439KB spark 矩阵分解 推荐算法
1
windows版本的clickhouse-odbc驱动
2022-04-27 10:58:10 15.93MB clickhouse-odbc
1
clickhouse-22.2.2.1-2.rpm离线安装包包含clickhouse-common-static-22.2.2.1-2.x86_64.rpm,clickhouse-client-22.2.2.1-2.noarch.rpm,clickhouse-server-22.2.2.1-2.noarch.rpm共3个离线安装rpm包。 安装: rpm -ivh clickhouse-common-static-22.2.2.1-2.x86_64.rpm rpm -ivh clickhouse-server-22.2.2.1-2.noarch.rpm rpm -ivh clickhouse-client-22.2.2.1-2.noarch.rpm clickhouse start vi /etc/clickhouse-server/config.xml vi /etc/clickhouse-server/users.xml 修数据库目录到大容量磁盘 如果要组成集群只要分别安装单机之后再配置/etc/metrika.xml 指定相互间的分片和备份情况即可。
2022-04-27 09:07:38 211.72MB linux 运维 服务器 clickhouse
1
使用Spark进行广度优先搜索 致谢 BFS算法和数据集的顺序版本摘自所著的 介绍 使用Spark进行无向图处理的并行广度优先搜索算法 安装 要求: JDK 7 , Maven , Spark 在service.properties文件中配置服务参数。 ####使用IDE运行 将库从sequence-libs文件夹添加到您的类路径。 使用Maven全新安装应用程序 mvn全新安装 使用以下命令启动主节点 火花类org.apache.spark.deploy.master.Master 使用以下命令启动从属节点 spark-class org.apache.spark.deploy.worker.Worker spark:// {masterIp}:7077 运行it.unitn.bd.bfs.BfsSpark类的main方法 ####运行Spark 使用Maven全新安装应用程
2022-04-25 20:13:43 36.08MB Java
1
Apache Spark 是专为大规模数据处理而设计的快速通用的计算引擎。 1.Spark有几种部署模式,各个模式的特点 1.本地模式 Spark不一定非要跑在hadoop集群,可以在本地,起多个线程的方式来指定。方便调试,本地模式分三类 local:只启动一个executor local[k]: 启动k个executor local:启动跟cpu数目相同的 executor 2.standalone模式 分布式部署集群,自带完整的服务,资源管理和任务监控是Spark自己监控,这个模式也是其他模式的基础 3.Spark on yarn模式 分布式部署集群,资源和任务监控交给yarn管理 粗粒度
2022-04-25 14:15:09 204KB ar ark executor
1
Spark SQL上海摩拜共享单车数据分析完整源码,使用Maven导包
2022-04-23 14:05:49 8.65MB spark 数据分析 java
1
spark官方版本的driver-class-path不支持hdfs路径,只支持本地路径。本资源解决了这个问题,driver-class-path在cluster模式时可以支持hdfs路径,解决了cluster模式driver有大量jar依赖的问题。
2022-04-23 09:05:55 20KB jar spark hdfs java
hadoop3.3.0-winutils所有bin文件,亲测有效
2022-04-21 21:00:31 1.02MB hadoop spark 大数据 java
1