此示例展示了如何对具有不平衡训练数据集的图像进行分类,其中每个类别的图像数量与类别不同。 两种最流行的解决方案是下采样和过采样。 在下采样中,每个类别的图像数量减少到所有类别中的最小图像数量。 另一方面,执行过采样时,每个类别的图像数量增加。 这两种策略对于不平衡的数据集都是有效的。 下采样的实现很简单:只需使用 splitEachLabel 函数并指定类的最小数量,但是,过采样需要更复杂的编码类型。 此代码不使用无法与增强数据存储关联的转换数据存储。 这意味着,到 2020 年,使用转换数据存储执行数据增强变得困难。
2022-05-07 17:16:08
40KB
matlab
1