hadoop集群一键部署脚本
2022-10-28 18:06:17 120KB hadoop spark yarn
1
Windows下配置IDEA的Spark的开发环境 下载Spark-hadoop的文件包,spark-2.4.5-bin-hadoop2.7,官网进行下载http://spark.apache.org/downloads.html IDEA下载Scala语言的开发插件,进行安装重启; 下载scala的包并进行安装,https://www.scala-lang.org/download/all.html,这个网页可以下载所有scala版本 idea创建普通的scala项目(个人使用的是JAVA的maven项目,然后创建子项目为scala项目),创建完子模块项目之后,将spark-2.4.5-bi
2022-10-28 01:16:47 49KB apache ar ark
1
如今,大量不同格式的异构数据可用于各种应用程序。 其中一个领域是犯罪调查。 在法医调查中,通常需要识别潜在指纹。 这种调查需要有效的计算方法。 随着现有存储技术的技术进步和局限性,需要有效的工具和技术来对庞大的数据集执行大数据分析和计算。 尽管大数据对法医专家来说是一个挑战,但它可以帮助他们检测犯罪模式,这是解决问题和了解现有情况的重要线索。 在本文中,我们使用 Apache Spark 分析了数据集中存在的潜在指纹图像。 这些实验有助于了解如何使用 SparkML 管道读取、处理和分析巨大的图像数据集。 此外,建议在现有框架上使用 Spark 中的深度学习改进识别和特征提取架构,以解决这一重要的研究问题。
2022-10-26 19:21:18 471KB 论文研究
1
将该jar包上传至flume/lib目录下,并将spark-streaming-flume其他版本jar包删除即可使用,该jar包适用于spark2.1.3版本使用
2022-10-23 20:14:33 85KB spark 整合
1
Nexmark 基准测试框架不依赖任何第三方服务,只需要部署好引擎和 Nexmark,通过脚本 nexmark/bin/run_query.sh all 即可等待并获得所有 query 下的 benchmark 结果。
2022-10-21 17:00:44 165KB nexwork
1
内容概要:由于cdh6.3.2的spark版本为2.4.0,并且spark-sql被阉割,现基于cdh6.3.2,scala2.12.0,java1.8,maven3.6.3,,对spark-3.2.2源码进行编译 应用:该资源可用于cdh6.3.2集群配置spark客户端,用于spark-sql
2022-10-20 19:07:22 254.33MB spark 大数据 cdh
1
大数据开发工程师2022(29周全,源码+课件+电子书+软件+接口数据),课程内容包含:Linux—>hadoop—>hbase—>hdfs—>Flume—>hive—>Impala—>Sclala—>Spark3.x—>kafka—>redis—>Flink1.15—>FlinkSQL—>Es—>数据中台
2022-10-20 14:08:24 188B 大数据 flink spark
1
《大数据开发工程师202》,29周完整版,附带源码+PDF课件+电子书+软件包,课程不定期升级,包升级! 课程结合大量企业级项目案例,手把手带你提升实战能力,从入门到入职,从基础到应用,最后达到中级大数据开发岗位能力标准
2022-10-18 14:08:35 721B 大数据 Hadoop spark
1
资源包含文件:课程报告word+源码及数据库sql文件 详细介绍参考:https://biyezuopin.blog.csdn.net/article/details/125047261
2022-10-15 15:04:50 20.13MB hadoop Spark Java 关联规则挖掘
大数据,数仓,实时数仓,用户画像,数据资产,数据湖
2022-10-12 17:06:10 71B flink spark data warehouse
1