不平衡的MLC
对于单标签分类(SLC)问题,已经对不平衡数据集对分类模型的有效性的影响进行了彻底和广泛的研究。 这些问题需要二进制分类输出来预测给定输入实例中单个类的存在。 在多标签分类(MLC)的域中,单个输入实例可能具有与其关联的多个类。 由于这种固有的标签并发性,应用于单标签分类问题的许多数据集不平衡补救措施在应用于多标签数据集(MLD)时均无效且可能有害。 例如,最常见的SLC不平衡补救措施之一是随机过采样。 也就是说,随机复制具有不常见标签的实例。 如果将这种幼稚的方法应用于MLD,我们很可能会复制在输入实例中同时存在的不想要的标签,甚至可能加剧数据集失衡的严重性。
这是对不平衡的多标签分类数据集上几种最新方法功效的实证分析。
实验装置
在我们的实验中,我们使用2017 Pascal VOC图像数据库,该数据库使用自定义的90%/ 10%火车/ Val数据集拆分,手动分区提
1