上传者: cpongm
|
上传时间: 2026-04-17 17:43:29
|
文件大小: 808KB
|
文件类型: PDF
"端到端增量学习解决方案"
本文旨在解决深度学习中的灾难性遗忘问题,即当使用增量添加新类进行训练时,整体性能急剧下降的问题。我们提出了一个端到端的增量学习方法,使用新数据和与旧类样本对应的小样本集,基于蒸馏措施和交叉熵损失来学习新类。我们的方法可以在保持整个框架端到端的同时实现联合学习数据表示和分类器,不像最近的方法没有这样的保证。
我们的方法可以解决在现实世界应用中的主要挑战之一,即增量地学习分类器,其中不断地学习新的类。例如,人脸识别系统必须处理新面孔以识别新人。这项任务需要在不必重新学习已经学习的面孔的情况下完成。我们的方法可以满足真正的增量学习者的所有特征,如从数据流中接受训练的能力、在划分新旧班级方面表现良好、模型的合理参数数目及内存要求、端到端学习机制等。
我们在CIFAR-100和ImageNet(ILSVRC 2012)图像分类数据集上广泛评估了我们的方法,并显示了最先进的结果。我们的方法可以应用于任何深度学习架构,并且可以用我们的代表性存储器组件来实现,该组件类似于用于维护与旧类对应的一小组样本的示例集。
我们的主要贡献是解决了当前深度学习方法在增量学习中的挑战,我们提出的端到端的方法专门为增量学习设计,能够满足真正的增量学习者的所有特征。我们的方法可以用任何深度学习架构实现,并且可以在保持整个框架端到端的同时实现联合学习数据表示和分类器。
在我们的方法中,我们使用蒸馏措施来保留从旧类获得的知识,并使用交叉熵损失来学习新类。我们的方法可以在不必重新学习已经学习的面孔的情况下,学习新的类别,并且可以满足真正的增量学习者的所有特征。
我们的方法可以应用于图像分类、人脸识别、目标检测等领域,并且可以满足真正的增量学习者的所有特征。我们的方法可以解决当前深度学习方法在增量学习中的挑战,并且可以满足实际应用中的需求。
我们的端到端增量学习解决方案可以解决当前深度学习方法在增量学习中的挑战,并且可以满足实际应用中的需求。我们的方法可以应用于任何深度学习架构,并且可以满足真正的增量学习者的所有特征。
在本文中,我们也对相关工作进行了总结和讨论,包括传统方法和深度学习框架学习特征的方法。我们也对我们的方法进行了详细的分析和讨论,并且对其在图像分类任务中的应用进行了评估。
我们的端到端增量学习解决方案可以解决当前深度学习方法在增量学习中的挑战,并且可以满足实际应用中的需求。我们的方法可以应用于任何深度学习架构,并且可以满足真正的增量学习者的所有特征。