【大数据+spark+数据清洗】hotel_data
学习大数据清洗的数据
对应文章:https://blog.csdn.net/weixin_44018458/article/details/128980802
数据内容:
省份,城市,商圈,星级,业务部门,房间数,图片数,评分,评论数,城市平均实住间夜,酒店总订单,酒店总间夜,酒店实住订单,酒店实住间夜,酒店直销订单,酒店直销间夜,酒店直销实住订单,酒店直销实住间夜,酒店直销拒单,酒店直销拒单率,城市直销订单,城市直销拒单率,拒单率是否小于等于直销城市均值
aba_2066,马尔康嘉绒大酒店,中国,四川,阿坝,NULL,四星级/高档,OTA,85,NULL,4.143799782,108,34.06,45,75,22,44,NULL,NULL,NULL,NULL,NULL,NULL,34147,7.90%,0
aba_2069,阿坝马尔康县澜峰大酒店,中国,四川,阿坝,NULL,二星及其他,低星,115,NULL,3.977930069,129,34.06,35,72,27,59,34,71,27,59,6,17.65%,34
1