Spark综合题题库.docx
2021-11-24 00:00:01 39KB spark
下载后可直接Maven导入工程运行即可,包含kafka的连接方法和数据插入、数据查询的测试工程
2021-11-23 18:02:04 9KB kafka
1
基于机器学习的Spark大数据平台自动调优机制研究--毕业设计.rar,关键词:大数据,spark,大数据平台自动调优机制,毕业设计
2021-11-23 17:33:11 160.82MB 大数据 spark 自动调优机制
1
Kyuubi是基于构建的高性能通用JDBC和SQL执行引擎。 Kyuubi的目标是促进用户处理大数据(如普通数据)。 它提供了标准化的JDBC接口,在大数据场景中具有易于使用的数据访问。 最终用户可以专注于开发自己的业务系统并挖掘数据价值,而不必了解底层的大数据平台(计算引擎,存储服务,元数据管理等)。 Kyuubi依靠Apache Spark提供高性能的数据查询功能,并且引擎功能的每一项改进都可以帮助Kyuubi的性能取得质的飞跃。 此外,Kyuubi通过引擎缓存提高了临时响应速度,并通过水平缩放和负载平衡增强了并发性。 它提供了完整的身份验证和身份验证服务,以确保数据和元数据的安全性。 它提供强大的高可用性和负载平衡,以帮助您保证SLA承诺。 它提供了两级弹性资源管理体系结构,可以有效地提高资源利用率,同时满足包括交互,批处理和点查询或全表扫描在内的所有方案的性能和响应要求。 它包
2021-11-23 16:02:17 17.45MB multi-tenant sql spark yarn
1
kafka-monitor kafka 消息积压告警监控 原本只是一个很简陋的需求:监控lag参数,超阈值发送告警短信 时间比较宽裕就加了一些保证健壮性和可用性的功能 由于发送短信的jar包不是开源的 就把对应jar包的配置文件ignore掉了, 可自行匹配相关jar包,修改相关代码和pom.xml 关于maven项目依赖本地jar包编译成可执行jar包可参考 后续将提供邮件提醒功能
2021-11-23 15:50:25 18KB Java
1
spark操作kudu所依赖的官方jar包 写入,建表,删除表等。。
2021-11-23 15:23:41 9.35MB spark_kudu
1
图片
2021-11-23 14:01:21 243KB kafka
1
6.2 ToolsTalk简介 ToolsTalk PF中几乎每个功能均有其自己的窗口。下图所示为ToolsTalk PF的界面,其上 设有菜单清单、选择面板、工具栏以及PF导览。 在ToolsTalk PF中,启动一个功能有多种方法。几乎所有功能均可以使用菜单列表中的菜 单项启动。点击工具栏中的符号,或者双击PF导览中的文本。 6.2.1 菜单列表 在PF菜单列表中有以下选项可用。 打开一个功能窗口时,在菜单列表中即显示一个新菜单。举例来讲,在打开一个 “Pset”窗口时,在菜单列表中即显示一个名称为“Pset”的新菜单。 菜单列表- 选择面板- 工具栏- PF导览
2021-11-23 10:03:26 4.44MB 阿特拉斯
1
hive on spark要求spark中不包含hive的jar包,必须重新编译,历尽艰辛终于搞好了,适配hive2.3、hadoop2.7.6环境。
2021-11-22 10:12:45 102.13MB spark
1
本地开发和运营 依存关系 确保您已将Python 2.7和pip一起安装。 然后运行: pip install -r requirements.txt 正在运行的工作 使用中央作业运行程序模块src/index.py运行所有作业。 您完全不需要编辑此文件。 python src/index.py 参数: src/spark_jobs.py定义的作业功能名称 生成的簇数 数据文件的文件路径(可以是项目中的绝对路径或本地路径) 这些作业可以占用多个文件。 这些应仅附加到命令中。 例如: python src/index.py user__reputation__to__upvotes_cast 3 tests/fixtures/users.xml 新增工作 所有作业均从src/s
2021-11-22 02:29:49 3.4MB python spark clustering pyspark
1