是大数据课程大作业,基于Hadoop的电影影评数据分析,需要安装Hadoop,了解MapReduce 和HDFS。
2024-04-22 15:09:31 1.49MB hadoop 数据分析
1
数据仓库Hive伪分布式部署与应用
2022-12-10 14:23:20 1.83MB hive Hadoop 数据仓库
1
1.支持分桶键导入和分区键导入。 2.建表通过EXCLE自带宏编辑进行处理,可修改源代码,灵活度较高。 3.使用方式:打开EXCEL—>视图—>宏—>执行(编辑可查看源码)
2022-10-13 15:38:05 83KB hive hadoop 数据仓库 大数据
1
基于Hadoop的汽车销售数据分析
2022-08-22 14:05:07 1.93MB Hadoop 数据分析
1
hive是基于Hadoop的一个数据仓库工具,用来进行数据提取、转化、加载,这是一种可以存储、查询和分析存储在Hadoop中的大规模数据的机制。
2022-08-11 14:05:44 121MB hive hadoop 数据仓库
1
hive连接工具waterdrop4.2免认证
2022-07-05 14:39:07 71.22MB hive hadoop 数据仓库 大数据
1
内容概要:包含spark2.2的升级包以及原始的spark1.6的包,其他的组件都可以使用 适用人员:在校大学生、数据开发、大数据开发、数仓开发、数据架构师等
2022-07-01 09:08:48 75B 大数据 hadoop 数据仓库
随着移动智能操作系统技术的突破,智能手机的普及,移动互联网时代的到来,web app每天都在产生TB甚至PB级的web日志,如何从这些海量日志信息中提取用户的个人爱好及其他信息,为用户提供个性化推荐服务,为人们的生活带来便利,成为各大互联网公司和科研机构研究人员的研究热点。由于开源云计算平台Hadoop的出现,解决海量web日志信息的数据挖掘成为可能。 本文的研究内容主要包含以下几个方面: 一、对Hadoop云计算平台进行研究。Hadoop是Apache下的顶级开源项目,该平台能够利用成千上万的廉价计算机提供并行计算与存储服务。本文主要深入研究了Hadoop平台下的HDFS分布式文件系统,并行编程模型MapReduce,分布式列型存储数据库HBase。 二、对聚类分析进行研究。聚类分析是数据挖掘中应用极为广泛的一类,本文主要研究了聚类分析的起源、定义和样本相似距离,并详细介绍了聚类分析的常用方法。 三、基于Hadoop平台,设计并实现了数据挖掘系统,.,系统封装了底层的Hadoop系统接口,提供了本文介绍的几种聚类算法服务。系统自顶向下的逻辑层次分别为用户层、服务引擎层、挖掘引擎层、底层Hadoop驱动层。 四、研究分析了K-Means和PAM聚类算法
2022-06-28 21:06:42 9.23MB Hadoop 数据挖掘 算法
1
里面包含着所有的项目源码,图片资源和课程学习安排文档,我们可以根据每天浏览某网站的人数和访客量来判断该网站的好坏和受欢迎程度, 同时也可以根据外链的跳转率和访客或会员所用的浏览器等工具的分析来进行精准的广告推广,我们也可以根据地区的点击量和访客或是会员访问的时间的分析来进行合理的商品推广、精准推荐等操作
2022-06-14 11:06:40 7.25MB 大数据 hadoop 数据分析 实战项目
1
Hive优化(思维导图)
2022-06-06 19:09:19 43KB hive hadoop 数据仓库 大数据
1