官网下载慢
2021-10-21 09:07:27 220.16MB spark
1
flinkSQL clickhouse连接器
2021-10-20 22:07:43 6.34MB flink clickhouse flinksql
1
SpringBoot集成JPA和Clickhouse数据库,实现java web操作, 通过docker创建clickhouse数据库环境,并使用DBeaver.exe 操作clickhouse数据库。使用Idea运行代码。其中通过MQTT进行消息的发布和订阅。内容包括fastjson的bean转json&string和string转json转bean。
2021-10-20 22:04:39 355KB springboot jpa mqtt clickhouse
1
点击率模型 基于纯Spark MLlib的CTR预测模型,无第三方库。 实现模型 朴素贝叶斯 逻辑回归 分解机 随机森林 梯度提升决策树 GBDT + LR 神经网络 内部产品神经网络(IPNN) 外部产品神经网络(OPNN) 用法 这是一个行家项目。 Spark版本是2.3.0。 Scala版本是2.11。 在maven自动导入依赖项之后,您可以简单地运行示例函数( com.ggstar.example.ModelSelection )来训练所有CTR模型并获得所有模型之间的指标比较。 有关点击率预测的相关论文 其他资源
2021-10-20 17:07:59 57KB machine-learning scala spark ctr-prediction
1
数据网 DataX Web是在DataX之上开发的分布式数据同步工具,提供简单易用的操作界面,减少用户使用DataX的学习成本,更改任务配置时间,避免配置过程中出错。用户可以通过页面选择数据源即可创建数据同步任务,支持RDBMS,Hive,HBase,ClickHouse,MongoDB等数据源,RDBMS数据源可批量创建数据同步任务,支持实时查看数据同步进度及日志并提供终止同步功能,集成并二次开发xxl -job可根据时间,自增主键增量同步数据。 任务“执行器”支持部署,支持执行器多字节路由策略选择,支持超时控制,失败重试,失败中断,任务依赖,执行器CPU。内存。负载的监控等等。后续提供更多的数据源支持,数据转换UDF,表结构同步,数据同步血缘等更复杂的业务场景。 架构图: 系统要求 语言:Java 8(jdk版本建议1.8.201以上) Python2.7(支持Python3需要修改
2021-10-20 11:47:29 19.53MB Java
1
spark替代Hive实现ETL作业
2021-10-20 01:44:13 1.41MB etl spark hive 替代hive
1
分享课程——《Flink动态规则实时智能营销系统(Flink+Clickhouse+Drools整合实现)》,基于Flink1.12.0版本,完整版,附带源码和课件,包含最新2021年8月升级版! 本系统,是一个基于事件驱动且可进行动态规则计算的实时系统。在技术上,它是通用的;本套架构及系统内核,不仅可以用于“实时营销运营”,也可以用于“实时风控”,“实时推荐”,“实时交通监控”等场景。 本项目是一个将大数据技术综合运用于核心业系统的经典案例项目的目标功能:提供可动态制定规则的实时营销消息推送;项目的可扩展适配场景:实时推荐,实时风控,实时精准广告推送等
2021-10-19 16:05:33 759B flink Clickhouse Drools
1
Spark源码
2021-10-19 14:13:33 14KB Spark源码
1
分享课程-Spark3+Clickhouse+Hadoop大数据实战课程。本课程采用项目驱动的方式,以Spark3和Clickhouse技术为突破口,带领学员快速入门Spark3+Clickhouse数据分析,促使学员成为一名高效且优秀的大数据分析人才。
2021-10-19 14:09:37 771B spark hadoop Clickhouse
1
Scala代码积累之spark streaming kafka 数据存入到hive源码实例,Scala代码积累之spark streaming kafka 数据存入到hive源码实例。
2021-10-19 13:38:34 3KB Scala
1