RKD实现对模型的蒸馏。与上一篇(https://blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/127787791?spm=1001.2014.3001.5501)蒸馏的方法有所不同,RKD是对展平层的特征做蒸馏,蒸馏的loss分为二阶的距离损失Distance-wise Loss和三阶的角度损失Angle-wise Loss。
链接:https://blog.csdn.net/hhhhhhhhhhwwwwwwwwww/article/details/127874090
2022-11-18 12:23:42
930.94MB
知识蒸馏