任务目标:基于所给数据集对饭店流量指标进行预测
不限方法,不限工具包使用。最终目标需给出预测结果,此题重在考察数据处理与建模能力
air_visit_data.csv数据集为饭店每天客流数据,其中visitors为标签
air_store_info.csv数据集为饭店所处位置信息数据
date_info.csv数据集为日历数据
sample_submission.csv为测试数据集,即提交结果(注意其格式,处理时需要把ID和日期分别提取,即预测每个饭店每天的流量情况)
weather文件夹为气象台下载数据,有能力的同学可以尝试加入天气特征,时间紧的话可以暂时不考虑这个
提示:请尝试对各个数据集进行特征提取,并整合特征,其中日期与时间指标可以做出来很多特征,大家可以多多尝试,需要提交的测试数据及并非标准格式,需要一些基本的预处理,即预测每个饭店每天的流量情况,处理测试集的时候需先对测试集补全所需特征,例如是否为节假日,星期几,区域信息等。
2021-10-13 18:04:07
41.42MB
数据挖掘