只为小站
首页
域名查询
文件下载
登录
使用
SparkSQL
分析图书信息
(1)创建RDD (2)将RDD转为DataFrame (3)调用registerTempTable,注册为表,表名为:tb_book (4)使用使用sql语句查询前15条 (5)模糊查询书名包含“微积分”的书 (6)输出图书的前10行的name和price字段信息 (7)统计书名包含“微积分”的书的数量 (8)查询评分大于9的图书,,且只展示前10条 (9)计算所有书名包含“微积分”的评分平均值 (10)把书目按照评分从高到低进行排列,且只展示前15条 (11)把图书按照出版社进行分组,统计出不同出版社图书的总数 (12)将书名包含“微积分”的书记录保存到本地或HDFS上,且保存的格式为csv,文件名为:学号.csv (13)然后再从该csv文件加载,创建DataFrame,并查询和显示
2019-12-21 20:45:17
1.54MB
DataFrame
spark
sql
python
1
SparkSQL
HDFS JAVA调用完整实例
SparkSQL
HDFS JAVA调用完整实例,使用Maven管理,项目很小,里面实例很多。敬请下载。
2019-12-21 20:30:43
30KB
SparkSQL
1
Spark最全操作完整示例代码
最全Spark操作完整示例代码-------是基于java的。 包含所有的spark常用算子操作和ml以及mlib、sparkstreaming、
sparkSQL
操作的示例DEMO。 内附有详细说明,由于内容过大删除了两个jar包,需要自己去下载,spark的安装包下的有这两个包,导入项目即可。懒得改maven项目了。 适合有一定基础和已经工作的人员下载学习。 个人Github: https://github.com/huangyueranbbc
2019-12-21 19:54:41
43B
spark
streaming
sparksql
大数据
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Academic+Phrasebank+2021+Edition+_中英文对照.pdf
机械臂碰撞检测 八组逆解碰撞检测 机械臂避障路径规划
CNN卷积神经网络Matlab实现
大学生网页设计大作业-5个网页设计制作作品自己任选
Vivado永久激活license(亲测可用)包(搜集的全部可用LICENSE)
Android小项目——新闻APP(源码)
基于OpenCV的车牌号码识别的Python代码(可直接运行)
画程(版本6.0.0.127)setup个人版
粒子群算法优化3-5-3多项式工业机器人时间最优轨迹规划算法matlab代码
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
JPEG的Matlab实现
Autojs 例子 源码 1600多个教程源码
云视通扫描工具.zip
2020年数学建模B题(国二)论文.pdf
2020年数学建模B题穿越沙漠全部代码全国赛二等奖.zip
最新下载
JSP花店管理系统.zip
花店管理系统
西北工业大学西工大数字集成电路.zip
BABOK V3.0 官方足本 业务分析必读之一 共514页
BABOK中文版.7z
SM768集成显卡手册
Artificial Intelligence: A Modern Approach 课程课件
2023全国职业院校技能大赛-GZ019 机电一体化技术赛题10套.rar
程序员的自我修养—链接、装载与库.pdf
Cracking the Coding Interview 6th 第6版 高清完整版PDF
其他资源
基于51单片机的温湿度传感器htu21d的驱动
IEC61850服务端模拟软件
ELMO EAS软件调试
基于SOLA女声变男声的课程设计
数据结构第二版课后答案完整版
研究生系列教材:多传感器数据融合及其应用
蒙特卡罗-无信息变量消除 特征提取 偏最小二乘建模
体育馆预约系统
百度地图添加marker
CT影像成像技术
UnityWWW下载压缩包并且解压到桌面
RFID安全加密
Intel Driver Update Utility v2.7.1.1.zip
android-mail.jar
钱包-源码
winhlp32.exe可用于XP和Win10下载@764_732.exe
pb各版本的补丁.zip
2021-01-26-SpringSecurity-OAUTH2-密码模式获取token-源码包hrm-itsource.rar
十进制计数器+七段译码器
西北工业大学 算法分析与设计期末考试 基础小题
排序(冒泡,选择,快速,归并,插入,折半插入,希尔,堆排序)