只为小站
首页
域名查询
文件下载
登录
使用
SparkSQL
分析图书信息
(1)创建RDD (2)将RDD转为DataFrame (3)调用registerTempTable,注册为表,表名为:tb_book (4)使用使用sql语句查询前15条 (5)模糊查询书名包含“微积分”的书 (6)输出图书的前10行的name和price字段信息 (7)统计书名包含“微积分”的书的数量 (8)查询评分大于9的图书,,且只展示前10条 (9)计算所有书名包含“微积分”的评分平均值 (10)把书目按照评分从高到低进行排列,且只展示前15条 (11)把图书按照出版社进行分组,统计出不同出版社图书的总数 (12)将书名包含“微积分”的书记录保存到本地或HDFS上,且保存的格式为csv,文件名为:学号.csv (13)然后再从该csv文件加载,创建DataFrame,并查询和显示
2019-12-21 20:45:17
1.54MB
DataFrame
spark
sql
python
1
SparkSQL
HDFS JAVA调用完整实例
SparkSQL
HDFS JAVA调用完整实例,使用Maven管理,项目很小,里面实例很多。敬请下载。
2019-12-21 20:30:43
30KB
SparkSQL
1
Spark最全操作完整示例代码
最全Spark操作完整示例代码-------是基于java的。 包含所有的spark常用算子操作和ml以及mlib、sparkstreaming、
sparkSQL
操作的示例DEMO。 内附有详细说明,由于内容过大删除了两个jar包,需要自己去下载,spark的安装包下的有这两个包,导入项目即可。懒得改maven项目了。 适合有一定基础和已经工作的人员下载学习。 个人Github: https://github.com/huangyueranbbc
2019-12-21 19:54:41
43B
spark
streaming
sparksql
大数据
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
机械臂避障路径规划仿真 蚁群算法 三维路径规划
基于hadoop商品推荐系统课程设计
MPC 模型预测控制matlab仿真程序
多目标优化算法(四)NSGA3的代码(python3.6)
2022学术英语写作(东南大学) 章节测试+期末test答案
copula程序及算法.zip
先进PID控制Matlab仿真第4版-PDF+代码.zip
全国道路网SHP数据.zip
模型预测控制MPC(模型预测电流控制,MPCC)的simulink仿真,2016b版本
PowerBI视觉对象共计271组,更新日期2021.01.20日.zip
故障诊断数据集及实现代码
中国地面气象站观测数据2000-2021
西门子逻辑控制设计开发_3部10层
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
python爬虫数据可视化分析大作业.zip
最新下载
java毕设基于web的花店管理系统项目源码+sql脚本
JSP花店管理系统.zip
花店管理系统
西北工业大学西工大数字集成电路.zip
BABOK V3.0 官方足本 业务分析必读之一 共514页
BABOK中文版.7z
SM768集成显卡手册
Artificial Intelligence: A Modern Approach 课程课件
2023全国职业院校技能大赛-GZ019 机电一体化技术赛题10套.rar
程序员的自我修养—链接、装载与库.pdf
其他资源
南瓜、西瓜、西红柿图片数据集
管家婆破解版
WEBRTC多人视频通话
开发板移植openwrt系统.pdf
电力系统分析的计算机算法 邱晓燕等编
Origin斜率计算插件
music算法的matlab程序
2017数学建模B题
使用并行计算大幅提升递归算法效率
jdk1.8.0_77_x64 解压缩免安装包
IZKCommonTools.zip
网络编程实用教程第二版_各章的示例源程序
SP37胎压传感器资料
世达02003焊台说明书.pdf
IT-软件开发规范.doc
高拍仪编程示例
Google Android手机嵌入式系统的研究与开发
基于CSocKet的网络应用五子棋设计与实现
ASC15 Preliminary Contest Notifications
信号与系统 陈后金 高教版 绝版答案
JAva+sql的网上购书系统
离散粒子群的代码
清华大学模式识别教材
DevExpress 18.1中文汉化包