centos安装配置hadoop Hadoop是Apache软件基金会旗下的一个开源分布式计算平台。以Hadoop分布式文件系统(HDFS,Hadoop Distributed Filesystem)和MapReduce(Google MapReduce的开源实现)为核心的Hadoop为用户提供了系统底层细节透明的分布式基础架构。
2023-02-23 10:23:21 4.19MB centos hadoop
1
Spark+GraphX大规模图计算和图挖掘的第一部分,,本文详细的介绍了如果用spark技术来处理graph的技术.
2023-02-22 20:22:33 37.06MB spark graphx
1
Hadoop和Python的Mapreduce 关于如何使用Python和Hadoop执行MapReduce的一小段回购。 映射器和化简器都是用Python编写的。 有关如何在Hadoop中实现这两个脚本的教程位于。
2023-02-22 17:06:20 1021KB Python
1
hadoop-common-2.7.3-bin-master 包含hadoop.dll、winutils.exe,下载后解压,配置HADOOP_HOME环境变量
2023-02-22 15:43:39 562KB hadoop hadoop-bin-windo winutils
1
Apache Hadoop官方文档,2.7.7版本,离线chm格式。之前我搜遍网络也没找到离线的官方文档,我就自己制作了一份chm格式的,希望对大家有用。
2023-02-21 16:11:48 8.96MB hadoop 官方文档 离线 2.7.7
1
Hadoop权威指南第四版中文版,高清扫描版,有源码 本文带来的资源是hadoop权威指南第四版中文版以及配套的源码,内容以Hadoop2.x为主,包含一些hadoop的stable版本的新特性,与之前 的版本相比增加了介绍YARN , Parquet , Flume, Crunch , Spark的章节适合于Hadoop 初学者。
2023-02-19 09:38:51 190.88MB Hadoop 权威指南 第四版
1
随着社会的发展,我们正步入一个信息技术世界。 在这样的世界中,由于电子商务,我们的生活变得越来越多样化和丰富。 电子商务不仅为我们提供了便利,还为我们提供了大量的业务数据。 但是,如何更好地存储,管理和使用这些业务数据已成为电子商务研究的主要领域。 随着数据量的快速增长,关系数据库系统无法满足当前状态的要求。 本文针对Hadoop业务数据的可视化分析模型,从可视化平台,数据库和分析模型等方面对业务数据进行了分析。根据分析,将对Hive数据库进行脱机数据分析和数据可视化。大大改进,因此可以为Hadoop业务数据的可视化分析模型提供参考和建议。
2023-02-18 14:50:28 1.08MB Hadoop的 业务数据可视化 分析模型
1
windows系统HDFS,能够使用java客户端操作HDFS(开发工具有IDEA,Eclipse插件)
2023-02-18 00:28:26 174.43MB hadoop
1
Spark Atlas连接器 用于跟踪Spark SQL / DataFrame转换并将元数据更改推送到Apache Atlas的连接器。 此连接器支持跟踪: SQL DDL,例如“创建/删除/更改数据库”,“创建/删除/更改表”。 SQL DML,例如“ CREATE TABLE tbl AS SELECT”,“ INSERT INTO ...”,“ LOAD DATA [LOCAL] INPATH”,“ INSERT OVERWRITE [LOCAL] DIRECTORY”等。 具有输入和输出的DataFrame转换 机器学习管道。 该连接器将与Hive,HDFS等其他系统关联,以跟踪Atlas中数据的生命周期。 如何建造 要使用此连接器,您将需要最新版本的Spark(Spark 2.3+),因为大多数功能仅在Spark 2.3.0+中存在。 要构建此项目,请执行: mv
2023-02-17 16:41:24 318KB apache-spark apache-atlas Scala
1
spark-sql-性能 一组针对Spark SQL的性能测试
2023-02-15 14:54:20 18KB Scala
1