分布最优平衡分层交叉验证 (DOB-SCV) 将数据集划分为 n 折,这样,除了基于标签的分层之外,还可以为每个类维护特征空间中的平衡分布。
使用 DOB-SCV 而不是分层交叉验证的实际效果是稍微提高了测试准确性。 最大的改进可以预期在小的、类别不平衡的数据集上。
该实现可用作CVPARTITION的直接替代。
参考:关于分区诱导的数据集偏移对 k 折交叉验证的影响的研究,可从https://ieeexplore.ieee.org/document/6226477 获得
2023-12-25 19:41:11
2KB
matlab
1