CatBoostLSS-CatBoost扩展到概率预测
我们提出了一个的新框架,该框架可预测单变量响应变量的整个条件分布。特别是, CatBoostLSS可以对参数分布的所有矩进行建模,即均值,位置,比例和形状(LSS),而不仅仅是条件均值。从广泛的连续分布,离散分布和混合离散连续分布中进行选择,对整个条件分布进行建模和预测可以大大增强CatBoost的灵活性,因为它可以使您对数据生成过程有更多的了解,并可以创建概率预测从中可以得出感兴趣的预测间隔和分位数。在下文中,我们简要介绍了CatBoostLSS的功能。
例子
模拟
我们从模拟的数据集开始,该数据集表现出异方差性,而其兴趣在于预测5%和95%的分位数。有关数据生成过程的详细信息,请参见。红色的点表示位于5%和95%分位数之外的点,由黑色虚线表示。
让我们将CatBoostLSS拟合到数据中。通常,语法类似于原始的CatBoost实现
1