上传者: 42108778
|
上传时间: 2021-12-04 16:29:44
|
文件大小: 10.35MB
|
文件类型: -
dengai2
第二次尝试来自DrivenData.org的DengAI挑战。 此处提供了挑战的链接: : 。 这项挑战的目的是预测城市中的登革热病例。 该疾病是通过蚊子传播的,因此预测登革热的数量与预测蚊子的数量高度相关。
回购概述
原始数据直接从DrivenData下载,位于data / raw文件夹下。 经过处理的文件夹将数据转换成可行的格式以用于某些模型测试后,其中包含数据。 所有代码都位于py文件夹中。
笔记本-探索
该文件的目的是获得数据的第一印象并进行所有认为的绘图。 发现:
应用KPSS和ADF测试,我们看到大多数时间序列都很好,尽管有些时间必须根据KPSS和ADF的特定测试结果进行差分或逆趋势处理。
对于某些变量,我们发现大量遗漏的观测值。 为了解决这个问题,我们应用KNNImputation并测试了不同数量的邻居。 为了评估插补的性能,我们在每次插补之后预测目