本实例使用 Flink 的有状态流处理和滑动窗口,实现实时点击量排行榜。 该实例统计过去 1 分钟内,点击量最高的男女用户各 10 名及其具体的点击数,同时每隔 1 秒(实时)更新统计结果,等到排行榜数据并将结果同步到 kafka 中。
2022-02-24 17:08:05 3.39MB flink 实时大数据 kafka
1
本实例使用 PyFlink + Scikit-Learn 基于kafka输入的实时手写体数据,在线训练一个手写体识别机器学习模型,以及提供实时的手写体识别服务;并实现对模型训练过程的实时监控。
2022-02-24 17:08:04 3.87MB flink sklearn 机器学习 实时大数据
1
PyFlink 流处理 MySQL CDC方式实时备份
2022-02-23 14:09:16 27.08MB mysql 数据库 database flink
1
本实例通过 Flink 结合 UDF 对系统上报的日志进行实时解析并生成告警,搭建实时监控告警系统
2022-02-22 14:10:58 1.59MB flink 大数据 big data
1
分享课程:Flink+ClickHouse 玩转企业级实时大数据开发,2022最新升级版19章全,提供配套的源码下载。 Flink已经成为高薪大数据工程师的必备技能,越早掌握,越能占得红利。本课程带你原理出发,构建知识体系,并引入热门OLAP引擎ClickHouse,整合Flink搭建企业级大数据实时分析应用,带你彻底打通Flink开发任督二脉。 新增第19章 【2022持续升级】Flink CDC编程实战
2022-02-22 14:10:58 700B Flink ClickHouse
1
flink-shaded-hadoop-2-uber-2.7.5-10.0.jar
2022-02-21 09:26:50 39.46MB jar flink hadoop java
1
# 解压命令 tar -zxvf flink-shaded-hadoop-2-uber-3.0.0-cdh6.2.0-7.0.jar.tar.gz # 介绍 用于CDH部署 Flink所依赖的jar包
2022-02-21 09:26:48 51.6MB jar flink hadoop java
1
Flink任务、Spark任务提交到集群,通常需要将可执行Jar上传到集群,手动执行任务提交指令,如果有配套的大数据平台则需要上传Jar,由调度系统进行任务提交。 对开发者来说,本地IDEA调试Flink、Spark任务不涉及对象的序列化及反序列化,任务在本地调试通过后,执行在分布式环境下也可能会出错。 而将任务提交到集群进行调试还要走那些繁琐的流程太影响效率了。 因此,为方便大数据开发人员进行快速开发调试,开发了从本地IDEA提交Flink/Spark任务到集群的工具类。任务提交代码稍加改造后也可以和上层调度系统进行集成,替代脚本模式进行任务提交的方式。 支持Flink yarnPerJob、Standalone 、yarnSession模式下的任务提交。 支持Spark任务以Yarn Cluster模式提交到YARN,支持自动上传用户Jar包,依赖的Spark Jars需要提前上传到H
2022-02-18 17:08:56 169KB spark yarn k8s flink
1
Flink行业案例.pdf
2022-02-17 20:04:37 30.06MB flink 大数据 big data
源码编译好的FLINK1.11版本,支持大数据CDH 6.2.0(Hadoop 3.0.0),Java 版本: 1.8.0_181,Scala-2.11
2022-02-17 16:46:45 343.89MB flink cloudera 大数据 流处理
1