这是一个使用 YOLO 前端和 Fast RCNN 后端的面罩检测模型。
我们使用 YOLO 的逐像素对象预测作为 Fast RCNN 的区域提议器。不同大小的像素(通过使用不同大小的过滤器)对应于这些位置不同大小的 RoI。这种架构是为人脸检测量身定制的,因为它最适合“方形”对象。
objectness>0.5 的位置被送入 Fast RCNN 后端,用于边界框回归和图像分类(如正确佩戴口罩、佩戴不当口罩、无口罩)
该模型建立在在 ImageNet 上预训练的 InceptionV3 之上
数据集取自 Kaggle