卡格莱雨
关于
kaggle 比赛的解决方案,在排行榜上得分约为 0.00775。
要重现结果,请先运行“preprocess.py”,然后运行“classif_model.py”
原始数据转换
来自原始数据的每个样本都提供了这段时间内雷达测量的序列,因此对于每个样本和每个测量,我计算了一段时间内的一些聚合(平均值、最小值、最大值、50% 百分位数、标准差)。 这一步在实现
初步分析
您可以在找到对预处理数据的一些主要分析
模型
这一步在实现
直觉
对于模型评估,使用,根据该,我需要预测从 0 到 69 的降雨量的累积概率。
我认为这是一个多类分类问题。 为了首先建立累积概率,我需要预测以下每个雨量计范围的概率:0, (0, 1], (1, 2], ..., (68, 69], (69, +inf))。总共有 71 个范围,所以这是一个有 71 个类别的分类任务。
有些类非常小(频率
2021-06-14 20:03:05
1.44MB
Python
1