基于大数据技术之电视收视率企业项目实战(hadoop+Spark)视频教程分享,本课程将通过一个电视收视率项目实战驱动讲解,项目案例是国内的一家广电企业作为非洲国家的一个运营商,以用户收视行为数据作为基础数据,通过对频道和节目的分析,采用多维度统计分析的方法挖掘用户的收视行为特征。 通过此案例可以学习大数据整体开发流程,课程是围绕一个大数据整理流程而做的教学课程,让大家明白大数据不同技术的相互协调,从收集数据,过滤数据,数据分析,数据展示,调度的使用而开发的课程,并且怎么从hadoop,hive应用快速的过度到spark上面而做的整套流程。学完此课程可以企业流程做一个整体的认识。
2021-08-01 18:07:10 427B hadoop spark
1
本资源是scala-2.12.11.tgz 用于linux的安装包,spark2以上需要用scala2.12以上的版本,本软件安全无毒,放心使用。便于大家的使用,可以直接下载使用。
2021-07-30 22:03:53 19.83MB scala spark hadoop jdk
1
spark-1.6.3-bin-hadoop2.4-without-hive.tgz 经测试,hadoop 2.8.2下可用。hive2.1.1 可用
2021-07-30 15:32:59 228.92MB Spark 1.6.3 without hive
1
Spark ML 特征工程之 One-Hot Encoding-附件资源
2021-07-29 17:48:26 106B
1
HiveHBaseTableOutputFormat cannot be cast to org.apache.hadoop.hive.ql.io.HiveOutputFormat 问题的补丁,替换jars文件夹下的对应jar包即可,版本spark2.1
2021-07-29 11:32:33 1.17MB spark hive hbase
1
ERROR : FAILED: Execution Error, return code 30041 from org.apache.hadoop.hive.ql.exec.spark.SparkTask. 前言报错信息异常分析配置改动后记 前言 在成功消除Cloudare管理界面上那些可恶的警告之后,我又对yarn的一些参数进行调优,最后重启了集群。当我提个任务(spark on yarn)并且看到并发及资源的分配情况正如自己先前所料的时候,我长舒了一口气,端起杯子拿上手机起身打算去接杯水消遣一下。 然而我一杯温水接完凑在嘴边,眼睛扫了一下手机刚打算痛饮一番的时候,同事在群里惊呼报错的消息就
2021-07-27 14:26:41 81KB ach ache apache
1
大数据基础知识思维导图(Xmind)-MapReduce、Spark、Hive、Yarn等大数据处理工具-附件资源
2021-07-27 10:12:58 106B
1
Spark in Action 英文无水印原版pdf pdf所有页面使用FoxitReader、PDF-XChangeViewer、SumatraPDF和Firefox测试都可以打开 本资源转载自网络,如有侵权,请联系上传者或csdn删除 查看此书详细信息请在美国亚马逊官网搜索此书
2021-07-26 23:27:28 8.59MB Spark in Action
1
基于DolphinScheduler构建大数据调度平台,课程会带大家构建DolphinScheduler大数据调度平台,实战讲解多种任务调度配置,会基于案例讲解DolphinScheduler使用,让大家在实战中掌握DolphinScheduler。
2021-07-26 19:05:29 712B DolphinScheduler spark 大数据
1
基于Hadoop安装完成前提下,安装Spark
2021-07-26 11:06:36 117KB Spark
1