成都信息工程大学大数据期末复习问题清单一
2022-12-26 19:27:09 500KB 大数据
1
cuit大数据实验3 111111111111111
2022-12-26 19:27:07 623KB 作业
1
1+X 大数据应用开发(Java)理论题库可能会用到的选择题(理论部分)知识点 在学校考1+x中级的同学可能用得到(已经考完了...)
2022-12-26 19:16:00 571KB 1+x中级理论部分
1
基于spark的电商用户行为分析系统源码+项目说明.zip 【环境】 spark 2.4.4 scala 2.11.8 hive 3.1.2 mysql 5.7.28 kafka_2.12-2.3.0 jdk 1.8.0_192 hadoop 2.9.2 zookeeper-3.5.5 Ubuntu 18.04 Windows10 Commons包:公共模块包 conf:配置工具类,获取commerce.properties文件中的所有配置信息, 使用户可以通过对象的方式访问commerce.properties中的所有配置 constant:常量接口,包括项目中所需要使用的所有常量 model: Spark SQL样例类,包括Spark SQL中的用户访问动作表、 用户信息表、产品表的样例类 pool:MySQL连接池,通过自定义MySQL连接池,实现对MySQL数据库 的操作 utils:工具类,提供了日期时间工具类、数字格式工具类、参数工具类、字符串工具类、校验工具类等工具类, 里面的类有: DateUtils:时间工具类,负责时间的格式化、判断时间先后、计算时间差值、获取指定日
第一部分、详细介绍了分布式数据库和Hbase的发展由来,基本原理,应用场景。第二部分,对Hbase进行基本的概述,主要介绍其中基本原理,第三部分对Hbase的技术进行详解,包括关键成员和技术优化。第四部分,通过一个小的java api案例,介绍Hbase的开发使用,详细分析hbase的应用场景和优化方式。
2022-12-25 18:59:01 5.76MB 大数据 Hbase Nosql 列式存储
1
前面的部分中,我们已经看到了RapidMiner Studio图形用户界面是如何建立起来的,以及如何用它来定义和执行分析流程。在流程的最后,流程结果会显示在结果视图中。现在在工具栏上点击一下就能跳转到结果视图了。这一章会详细阐述结果视图。依据您是否已经生成了可被描述的结果,在默认设置前提下,您现在应该至少能大致看到这些显示内容,如图4.1所示。
2022-12-25 12:30:58 1.3MB 大数据 数据挖掘 Rapidminer 数据可视化
1
第2章 RapidMiner Studio简介 RapidMiner Studio 结合技术性和适用性,为最新的及已建立的人性化数据挖掘技术提供服务。通过推拽算子,设置参数及组合算子,在RapidMiner Studio中定义分析流程。
2022-12-25 12:24:12 3.56MB 数据挖掘 大数据 Rapidminer
1
包括 院校代码 院校名称 专业名称 专业代码 省份 批次 招生计划数 文科录取分数 理科录取分数
2022-12-24 18:25:33 56.64MB 大数据
1
为了有效的演示实验,更好的将理论与实验相结合,博主制作了本实验报告。本实验中分别有构建虚拟机网络。大数据环境安装以及大数据分析案例三部分实验,希望对大家有所帮助。 Hadoop简介: Hadoop 是由 Apache 研发的开源分布式基础架构,它由 Hadoop 内核、MapReduce、 Hadoop 分布式文件系统(HDFS)及一些相关项目组成。其中,HDFS具有高容错性,负责大数据存储;MapReduce 则负责对 HDFS 中的大量数据进行复杂的分布式计算。Hadoop 作为分布式架构,采用“分而治之”的设计十思想:将大量数据分布式地存放于大量服务器上,采用分治的方式对大数据进行分析。 在这种思想的驱使下,Hadoop 实现了 MapReduce 的编程范式。其中,“Map”意为映射 其工作是将一个键值对分解为多个键值对;“Reduce”意为归约,其工作是将多组键值产对处理合并后产生新的键值对写入 HDFS。通过上述工作原理,MapReduce 实现了将大数据工作拆分为多个小规模数据任务在大量服务器上分布式处理。
1
大数据技术原理与应用 林子雨版 课后习题答案(第3版).xdf
2022-12-23 23:08:34 1.92MB
1