主要介绍了Python利用多进程将大量数据放入有限内存的教程,使用了multiprocessing和pandas来加速内存中的操作,需要的朋友可以参考下
2022-10-21 23:43:06 137KB Python 大数据
1
H13-723HCIP-BigData大数据考题.pdf
2022-10-21 13:04:53 2.91MB HCIP-BigData
大厂大数据最新面试真题
2022-10-21 09:06:39 683KB 大数据 Hadoop flink 数仓
1
大数据技术之高频面试题
2022-10-21 09:06:38 4.44MB 大数据 数据仓库 Hadoop Flink
1
Kafka是一种高吞吐量的分布式发布订阅消息系统,有如下特性: 高吞吐量,即使是非常普通的硬件Kafka也可以支持每秒数百万的消息。
2022-10-20 19:07:37 6.93MB 大数据
1
内容概要:由于cdh6.3.2的spark版本为2.4.0,并且spark-sql被阉割,现基于cdh6.3.2,scala2.12.0,java1.8,maven3.6.3,,对spark-3.2.2源码进行编译 应用:该资源可用于cdh6.3.2集群配置spark客户端,用于spark-sql
2022-10-20 19:07:22 254.33MB spark 大数据 cdh
1
本压缩包可供个人学习实践使用,严禁除此以外的一切用途!违法必究
2022-10-20 19:05:13 1.79MB etl 数据库 大数据 数据清洗
1
大数据视频教程分享2022最新
2022-10-20 16:05:08 335B 大数据 Hadoop flink
1
大数据开发工程师2022(29周全,源码+课件+电子书+软件+接口数据),课程内容包含:Linux—>hadoop—>hbase—>hdfs—>Flume—>hive—>Impala—>Sclala—>Spark3.x—>kafka—>redis—>Flink1.15—>FlinkSQL—>Es—>数据中台
2022-10-20 14:08:24 188B 大数据 flink spark
1