深度学习中,对不同类的数据集图片进行分类,使得训练集、测试集、验证集中含有的图片类别不冲突。例如我手头有一个医学图像处理的数据集,我要检测图片中的病变类别,分清他是肿瘤、创伤还是其它问题,因为每一类图片都对应着多个病人,但在实际训练过程中,同一个病人的病变图片差不多,如果分属于训练集、验证集、测试集,那么检测精度一定会有是会有所下降,所以需要先进行一次分类。这个程序就是起到这样一个作用。classify.py
#读取图片前六位
def sixTop(fileList):
sixTopName = list()
for name in fileList:
sixTopName.append(name[0:6])
return sixTopName
#判断前六位数字是否重复,输出次数
def imgRepeat(L):
repeatList = []
setList = set(L)
flag=True
if len(L) != len(setList):
flag=False
1