天猫大数据竞赛——资金流入流出预测
竞赛过程中挖掘到的信息及决赛注意事项
模型选择
ARIMA (HW)+ LM 预测整月的数据
对一些特征点进行调优 (中秋,调休,国庆前)
决赛相对之前的升级:
模型方面主要是增加了数据预处理 和 线性模型中的特征;
特殊时间点方面,主要是更好的刻画了月初、月末的特征.
关于评测
如果评测机会比较充足,了解一下自己的purchase得分和redeem得分对后续方向的指导意义比较大,purchase由于比较稳定,所以得分应该更高;而redeem会因为波动比较大,预测难一些;
不要迷信用八月份的数据做线下评测得到的效果,八月份数据略坑,及早从坑里爬出来.一般来说;
评估函数不是线性的,越准确上分速度越快,加入一些小幅的噪声有可能能够提高成绩;
基本流程
需要对整体数据做一个处理,比如数据预处理、分解、汇总,这个正好使用ODPS,语法同HIVE,可以查HIVE
2021-11-14 22:51:05
13KB
Python
1