本数据集包含了人疲劳时的一些照片,建议训练时可以把打哈欠张嘴的状态和闭眼的状态作为疲劳标准,以此来进行一个新手练习的小项目。
经过测试发现,由于原数据集中存在图片数据与标注数据不匹配的问题,故我们需要将不匹配的这部分数据删除。
代码参考如下
import os,shutil
jpeg = ‘Dataset/dataset/JPEGImages’
jpeg_list = os.listdir(jpeg)
anno = ‘Dataset/dataset/Annotations’
anno_list = os.listdir(anno)
for pic in jpeg_list:
name = pic.split(‘.’)[0]
anno_name = name + ‘.xml’
print(anno_name)
if anno_name not in anno_list:
os.remove(os.path.join(jpeg,pic))