本文描述了最新的回归技术随机森林分位数回归森林(QRF)的新扩展,以应用于具有数千个特征的高维数据。 我们提出了一种新的子空间采样方法,该方法从两个单独的特征集中随机抽取一个特征子集,一个特征集包含重要特征,另一个特征集包含次要特征。 这两个功能部件集基于功能部件的重要性度量对输入数据进行分区。 通过使用特征置换产生分区原始重要性特征评分首先进行,然后应用p值评估将重要特征与次要特征分开。 新的子空间采样方法能够从袋装样本数据生成树,而回归误差较小。 对于点回归,我们从两个分位数Q0:05和Q0:95之间的范围中选择Y的预测值,而不是回归随机森林中使用的条件均值。我们的实验结果表明,具有这些扩展的随机森林要优于回归随机森林和分位数回归森林减少均方根残差。
1