HIVE建表; Mysql同步HIVE; HIVE同步Mysql; HIVE运算;
2022-07-06 13:04:28 575KB hadoop spark hive dolphinscheduler
1
评分表(ratings.dat)︰用户ID::电影ID::评分::时间戳 用户表(users.dat):用户ID::性别::年龄:.职业代码::邮编 电影表(movies.dat)︰电影ID::名字:类别 注:年龄和职业代码参见READM 1.男女用户的比例 2.每个用户的平均评分中,排名前十和最后十名的用户及其评分分别是多少 3.按性别计算每部电影的平均得分 4.过滤掉评分数据不够250条的电影,按性别计算每部电影的平均得分 5.男女观众分别最喜欢的前10部电影 6.男女观众评分差别最大的10部电影 7.所有观众评分分歧最大的10部电影(电影评分标准差大者,分歧则大)
2022-07-06 09:12:07 246KB spark rdd
1
AdXmpp(Openfire+asmack+spark) Android 源码.zip
2022-07-05 18:08:01 2MB Android
大数据时代: 数据量大 数据种类繁多 数据增长速度快 大数据不同层面及技术: 大数据关键技术: 分布式存储 GFS/HDFS BigTable/HBase NoSQL(键值、列族、图形、文档数据库) NewSQL(如 : SQL Azure ) 分布式处理框架: Hadoop Storm Flink Spark hadoop: hadoop是Apache软件基金会旗下的一个开源式计算平台为用户提供了系统底层细节透明的分布式基础架构 Hadoop是java编写的开源、可伸缩和容错的框架,并且可部署在廉价的计算机集群中 hadoop以分布式文件系统HDFS和MapReduce为核心进行海量数据的
2022-07-04 15:55:51 94KB ar ark hadoop
1
spark高级分析数据源码,这本书的事例代码都在这里面。在你学习的时候可以下下来查看交流
2022-07-01 22:16:48 70.58MB 大数据 spark
1
一本详细讲解kudu,impala和spark的原著
2022-07-01 18:07:27 54.3MB spark
1
spark 3.3.0
2022-07-01 15:03:46 292.15MB spark
1
内容:包括cm与cdh两个包 使用人群:大学生、数据开发
2022-07-01 09:08:54 155B hadoop 大数据 spark
自学资料,sparkcore
2022-06-30 14:06:12 64.98MB hadoop spark
1
本项目主要是对一些常用的算法的实现,以及基于spark的机器学习算法实现。 目前以实现的功能有: * 数据预处理 * 基于spark的LR逻辑回归分类 * 基于spark的DT决策树分类
2022-06-29 19:09:40 10.66MB spark big data Scala