对于学习大数据的最好的数据集,数据简单,但是网络上只有少数几年的数据,规模不大,本人直接从美国ncdc官网爬下来的(每次只能上传220,所以需要分批上传)
2021-11-28 10:43:30 169.63MB hadoop dataset spark scala
1
spark读取hudi,hudi版本0.10
2021-11-27 22:00:31 36.91MB spark hudi 0.10
1
许多分布式计算系统都可以实时或接近实时地处理大数据流。本文将对三种Apache框架分别进行简单介绍,然后尝试快速、高度概述其异同。在Storm中,先要设计一个用于实时计算的图状结构,我们称之为拓扑(topology)。这个拓扑将会被提交给集群,由集群中的主控节点(masternode)分发代码,将任务分配给工作节点(workernode)执行。一个拓扑中包括spout和bolt两种角色,其中spout发送消息,负责将数据流以tuple元组的形式发送出去;而bolt则负责转换这些数据流,在bolt中可以完成计算、过滤等操作,bolt自身也可以随机将数据发送给其他bolt。由spout发射出的tu
1
「基础架构安全」内建安全的软件开发 - 安全威胁 安全意识 攻防靶场 web安全 安全运营 安全方案
2021-11-26 21:00:08 1.62MB 渗透测试 网络安全 数据库审计 spark
最新版本的及时通讯资源文件,openfire和spark,简单的解压就可以运行的设置
2021-11-26 15:48:00 32.74MB openfire spark 及时通讯 xmpp
1
Java连接包
2021-11-25 18:24:35 278KB pychar
1
比较直观的官方文档. 包括了大中小规模的部署规划参考方案 云存储,大数据分析,大数据流计算的不同方案
2021-11-24 23:25:39 1.17MB CDH 大数据 hadoop spark
1
spark集群安装搭建,step by step,详细记录整个安装过程。
2021-11-24 21:38:01 309KB spark 集群 部署
1
Spark Streaming实时流处理项目实战.rar.rar
2021-11-24 19:49:25 130KB Spark Streaming实
1
Framework-Of-BigData 大数据面试题,从0到1走向架构师之路。Flink、Spark、Hive、HBase、Hadoop、Kettle、Kafka... 每周日更新 项目系列 一、大数据项目 面试系列 优秀文章目录 一、Hadoop HDFS是如何设计架构的 最新Hadoop面试题总结 二、Flink 十分钟入门Fink SQL Flink SQL——Table与DataStream之间的互转(超详细) Flink SQL Sink(文件、kafka、Stream) 一文章带你深入了解Flink SQL流处理中的特殊概念(超详细) 一文章让深入理解Flink SQL 时间特性(超详细) 一文章带你深入理解FlinkSQL中的窗口(三种模式) Flink系统自带函数与自定义UDF(超详细) 那些被问懵的Flink面试题(Flink面试急需) Flink 自定义Avro序列化
2021-11-24 17:12:11 145.33MB
1