【大数据+spark+数据清洗】hotel_data 学习大数据清洗的数据 对应文章:https://blog.csdn.net/weixin_44018458/article/details/128980802 数据内容: 省份,城市,商圈,星级,业务部门,房间数,图片数,评分,评论数,城市平均实住间夜,酒店总订单,酒店总间夜,酒店实住订单,酒店实住间夜,酒店直销订单,酒店直销间夜,酒店直销实住订单,酒店直销实住间夜,酒店直销拒单,酒店直销拒单率,城市直销订单,城市直销拒单率,拒单率是否小于等于直销城市均值 aba_2066,马尔康嘉绒大酒店,中国,四川,阿坝,NULL,四星级/高档,OTA,85,NULL,4.143799782,108,34.06,45,75,22,44,NULL,NULL,NULL,NULL,NULL,NULL,34147,7.90%,0 aba_2069,阿坝马尔康县澜峰大酒店,中国,四川,阿坝,NULL,二星及其他,低星,115,NULL,3.977930069,129,34.06,35,72,27,59,34,71,27,59,6,17.65%,34
1
大数据Spark企业级实战 PDF电子书 带书签目录
2023-05-23 14:44:49 12.77MB 大数据 Spark 企业级实战 PDF电子书
1
<数据算法--Hadoop-Spark大数据处理技巧>.pdf全书686页,英文比中文容易理解 本资料共包含以下附件: 724f58d66ab6b3c4c6412e91117878cb.zip
2023-03-20 11:11:06 36.93MB 大数据 spark
1
大数据Spark企业级实战版 带书签
2023-02-26 23:43:23 111.09MB Spark
1
《Spark 调优攻略上册》是整合互联⽹优质的Blog与PPT形成的攻略,它主要对于企业级⼤规模数据计算引擎Spark多维度优化策略。本次整理不单单是Apache spark还涵盖了Data Lake和阿⾥云EMR智能团队研发的Jindo-Spark是如何基于Apache spark进⾏多维优化及实现原理,让读者能够知其然且知其所以然。
2022-12-31 14:23:20 25.42MB 攻略 大数据 Spark调优
1
本文SparkStream从磁盘文件、HDFS、KAFKA获取数据源,以单词频次统计作为入门案例,介绍了SparkStream模块API的使用。同时介绍了SparkStream的特点
2022-12-29 17:25:28 354KB 大数据 Spark SparkStreaming
1
spark实验二的代码与报告 1.掌握Java Spark API开发Spark应用的方法;2.掌握分布式环境下Spark应用的部署运行;
2022-12-28 22:51:18 915KB 大数据 spark
1
在学习了基础知识之后,感觉缺少点东西作为练习。这个可以作为一种考虑。
2022-12-19 17:03:29 114.49MB spark 实战
1
大数据~有关于RDD编程初级实践的学习报告 小丸子帮大家总结到位了 希望可以帮助各位 点赞收藏哈!!!
2022-11-22 14:03:17 2.37MB 大数据 spark 操作系统 RDD编程
1
大数据,spark项目,straming
2022-09-02 12:14:14 4.09MB 大数据spark
1