HCIE-Bigdata笔试,内容丰富
2022-02-14 14:09:37 363KB big data 大数据
1.《深入理解Flink核心设计与实践原理》-随书代码 整个工程共有【182个Java文件】,你要的Demo这里都有。 《深入理解Flink核心设计与实践原理》一书中针对该工程中的Flink示例代码进行逐步的详细讲解,并推荐大家购买《深入理解Flink核心设计与实践原理》一书来获得更好的学习体验。 本书从Apache Flink的缘起开始,由浅入深,理论结合实践,全方位地介绍Apache Flink这一处理海量数据集的高性能工具。本书围绕部署,流处理,批处理,表格API和SQL四大模块进行讲解,并详细说明Apache Flink的每个特性的实际业务背景,使读者可以轻松编写可运行的Apache
2022-02-12 17:50:40 1.01MB java scala bigdata flink
1
简单的电影推荐系统 采用协同过滤算法生成模型,进行预测推荐 实验环境:Ubuntu 19.04 + Hadoop 2.9.0 + Spark 2.4.3 + Python 3.7.3 实验工具:Jupyter笔记本 具体内容:ml-100k.zip文件是此实验的数据集,使用其中的u.data和u.item文件。
2022-01-19 16:40:49 4.7MB 系统开源
1
北京林业大学大数据技术基础期末复习提纲(PDF版)
2021-12-31 19:07:32 3.64MB 大数据 北京林业大学 期末考试
bigdata_analyse 大数据分析项目 希望 采用不同的技术栈,通过对不同行业的数据集进行分析,期望达到以下目标: 了解不同领域的业务分析指标 深化数据处理,数据分析,数据可视化能力 增加大数据批处理,流处理的实践经验 增加数据挖掘的实践经验 小费 项目主要使用的编程语言是python,sql,hql .ipynb可以用jupyter notebook :,如何安装,可以参考 jupyter notebook是一种网页交互形式的python编辑器,直接通过pip安装,也支持markdown,很适合用来做数据分析可视化以及写文章,写示例代码等。 列表 主题 处理方式 技术栈 数据集下载 离线处理 清洗蜂巢+分析蜂巢+可视化echarts 或者提取码:5ipq 实时处理 数据源kafka +实时分析flink +可视化(es + kibana) 提取码:m4mc 离线处理 清洗熊
2021-12-18 21:50:28 464KB Python
1
Talend Open Studio 是开源的数据分析平台,用于etl相当好用。优势是java平台的开放性可以让你随心所欲地进行数据分析。对于对java熟悉的人员做etl相当适合
2021-12-10 14:43:55 5.04MB ETL Talend bigdata database
1
Mastering Kafka Streams and ksqlDB
2021-12-10 09:11:23 9.11MB Bigdata
1
C++实现,其中包含大整数的源代码以及技术文档,一些课程设计实验可进行参考
2021-12-04 19:37:59 2.7MB C++ bigdata
1
Framework-Of-BigData 大数据面试题,从0到1走向架构师之路。Flink、Spark、Hive、HBase、Hadoop、Kettle、Kafka... 每周日更新 项目系列 一、大数据项目 面试系列 优秀文章目录 一、Hadoop HDFS是如何设计架构的 最新Hadoop面试题总结 二、Flink 十分钟入门Fink SQL Flink SQL——Table与DataStream之间的互转(超详细) Flink SQL Sink(文件、kafka、Stream) 一文章带你深入了解Flink SQL流处理中的特殊概念(超详细) 一文章让深入理解Flink SQL 时间特性(超详细) 一文章带你深入理解FlinkSQL中的窗口(三种模式) Flink系统自带函数与自定义UDF(超详细) 那些被问懵的Flink面试题(Flink面试急需) Flink 自定义Avro序列化
2021-11-24 17:12:11 145.33MB
1
华为HCIA-Big Data【大数据】_培训教材和实验指导手册
2021-11-19 18:08:11 147.31MB 华为 HCIA BigData