深度学习中,对不同类的数据集图片进行分类,使得训练集、测试集、验证集中含有的图片类别不冲突。例如我手头有一个医学图像处理的数据集,我要检测图片中的病变类别,分清他是肿瘤、创伤还是其它问题,因为每一类图片都对应着多个病人,但在实际训练过程中,同一个病人的病变图片差不多,如果分属于训练集、验证集、测试集,那么检测精度一定会有是会有所下降,所以需要先进行一次分类。这个程序就是起到这样一个作用。classify.py #读取图片前六位 def sixTop(fileList): sixTopName = list() for name in fileList: sixTopName.append(name[0:6]) return sixTopName #判断前六位数字是否重复,输出次数 def imgRepeat(L): repeatList = [] setList = set(L) flag=True if len(L) != len(setList): flag=False
2023-03-24 20:00:48 6KB python 深度学习 数据集分类
1
超全的 3D 视觉数据集汇总.pdf 21个深度学习开源数据集分类汇总.pdf 行人检测.docx 15个目标检测开源数据集汇总.pdf 10个工业检测数据集.docx
2023-03-23 17:00:14 31.81MB 数据集 深度学习
1
中文乐谱数据集内含几百首乐谱格式为xml可以作为歌声合成的数据集.zip
2022-12-20 15:27:47 1.05MB 歌声合成 深度学习 数据集
螺钉异常检测图片数据集,这个数据集中有三个文件train、test和gound_truth。训练集有320 (1024x1024)张没有异常的螺钉图片,测试文件有良好,操纵前,刮刮头,刮刮颈,线程边,线程顶,总共160张图片与匹配的groundtruth。
2022-12-18 18:29:13 186.54MB 深度学习 数据集 图片 螺钉
绿幕背景下人体交通指挥形态数据集,每类有30张图片左右 绿幕背景下人体交通指挥形态数据集,每类有30张图片左右 绿幕背景下人体交通指挥形态数据集,每类有30张图片左右
2022-12-18 18:29:12 97.51MB 交通指挥 深度学习 数据集 人体
马铃薯叶片数据集,使用标签工具注释土豆叶子。注释分为两类,共52张马铃薯叶子生镜照片 马铃薯叶片数据集,使用标签工具注释土豆叶子。注释分为两类,共52张马铃薯叶子生镜照片 马铃薯叶片数据集,使用标签工具注释土豆叶子。注释分为两类,共52张马铃薯叶子生镜照片
2022-12-18 18:29:09 38.14MB 深度学习 数据集 图片 马铃薯
马与人分类图像数据集,共有1282张图片 马与人分类图像数据集,共有1282张图片 马与人分类图像数据集,共有1282张图片
2022-12-18 18:29:08 153.69MB 深度学习 数据集 分类
猫和兔子分类数据集,有两组数据。第一个数据集“train-cat-rabbit”有两个子集猫和兔子,每个子文件包含大约800张图像。第二个数据集是一个验证数据集,它的目录类似于train-cat-rabbit文件,每个子文件夹包含大约200个图像。这可以用于验证模型。
两个数据集都相对较小,所有图像都被重塑为(300,300)。
2022-12-18 18:29:07 65.93MB 深度学习 数据集 兔子 分类
美丑等级分类图像数据集,数据集由训练集、测试集、验证集和整合集组成。每组包含两个文件夹,分别为Beautiful和Average。对于训练集,Beautiful文件夹中有2000张图像,Average文件夹中有2000张图像。对于测试集,beautiful文件夹中有150张图像,Average文件夹中有150张图像。验证集类似地分为每种类型的150个图像。合并文件夹2300张图片在Beautiful文件夹和2300张图片在Average文件夹。
2022-12-18 18:29:07 139.92MB 深度学习 数据集 相貌 分类
蜜箱出入口蜜蜂数据集,包含携带花粉和不携带花粉的蜜蜂的图像。共包含714张图片,可以用于判断蜜蜂有没有携带花粉 蜜箱出入口蜜蜂数据集,包含携带花粉和不携带花粉的蜜蜂的图像。共包含714张图片,可以用于判断蜜蜂有没有携带花粉
2022-12-18 18:29:06 19.98MB 深度学习 数据集 蜜蜂 蜜箱