默认下载的Hadoop不支持Windows系统,需要替换bin目录下的文件方便在Windows上运行。这个就是用来直接替换掉hadoop目录下bin文件的
2023-01-11 15:12:11 1.04MB win10安装Hadoop
1
hadoop-2.7.0.zip
2023-01-10 21:44:23 1.08MB hadoop
1
按照餐饮的分类来爬虫的,数量不多,但是可以自己改餐饮分类一直爬。 可视化运用的是pyecharts。 大数据处理技术的课程项目数据预处理。
2023-01-07 17:36:54 181KB 大数据 hadoop Python 爬虫
1
spark的官方示例源代码,包括wordcount,操作数据库,访问parqurt,json文件等等
2023-01-06 17:26:51 2.34MB spark 源代码示例
1
hadoop-3.3.4源码包
2023-01-05 17:26:35 33.98MB hadoop 大数据 3.3.4
1
《Spark+ClickHouse实战企业级数据仓库,进军大厂必备》,2023年1月最新升级版21章全
2023-01-05 17:26:34 210B Spark+ClickHouse ClickHouse
1
分享大数据课程——《Spark+ClickHouse实战企业级数据仓库,进军大厂必备》,2023年1月最新升级版21章全!本课程结合ClickHouse+Spark 这一对数据处理的“黄金搭档”,选取“大数据量企业数据仓库“这一典型场景,实战大数据量下数仓的建模、设计与调优等实用技巧,快速掌握ClickHouse+Spark核心技能,为晋级大数据架构师铺路!
2023-01-05 13:24:15 653B ClickHouse Spark
1
基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。 基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平台大数据分析项目源码.zip 已获导师指导并通过的高分项目,下载即用,无需修改。基于hadoop平台hive数据库的taptap游戏平
基于Hadoop的hive数据库的网站流量日志数据分析系统项目源码.zip 已获导师指导并通过的高分项目。下载即用,内附说明。项目背景 1、项目名 “网站流量日志数据分析系统” 2、概念 a、点击流 点击流(Click Stream)是指用户在网站上持续访问的轨迹,形成点击事件,它会记录用户浏览站点的整个过程。 image-20211123085322048 二、日志数据的数据格式 image-20211123090020444 页面点击流数据 image-20211123091013446 点击流模型Visits表 image-20211123091120698 三、骨灰级指标 1、IP 1天之内,不重复的ip数,统计ip数 2、PV 页面加载的总次数 3、UV 1天之内,访问网站的不重复用户数(以浏览器cookie为依据),一天内同一访客多次访问网站只被计算1次。 四、整体技术架构流程 1、数据采集 2、数据预处理 3、数据入库 4、数据分析 5、数据展示 image-20211201143716799 image-20211123114258257 五、技术分析
整个系统分为三大功能块,分别是:图构建模块,可视化模块和顶点分析模块。 在顶点分析模块中,用户可以进行顶点重要程度分析、顶点分组(聚类)、顶点邻居计算、顶点到顶点路径计算等多角度的分析。
2023-01-04 18:23:16 5.93MB 编号:100010313 Spark 课程设计