answer文件夹为测试语料,共9833篇文档;train文件夹为训练语料,共9804篇文档,分为20个类别。训练语料和测试语料基本按照1:1的比例来划分。收集工作花费了不少人力和物力,所以请大家在使用时尽量注明来源(复旦大学计算机信息与技术系国际数据库中心自然语言处理小组)。文件较大(训练测试集压缩包各50多兆)
2021-06-01 19:28:39 105.93MB 机器学习 文本分类 分类语料 中文语料库
1
coco训练集trainvalno5k.part(2014),coco训练集train图片相对路径,如果找不到图片路径,将相对路径改为绝对路径
2021-05-29 10:13:40 5.46MB coco
1
训练集train.py
2021-05-25 10:05:41 5KB python
1
输入原始图片所在文件夹,原始图片标签,输出增强后的图片文件夹名及输出标签名,运行即可。
1
资源中包括数字和字母,都是二值化以后的,还有汉字,省份汉字都是还没有经过处理,都是从最初车牌中扣下来,还有网上一些文本中扣出来的,自己可以处理,用于灰度识别,或者二值识别
2021-05-19 13:08:12 50.44MB 字符识别 车牌识别 省份简称
1
车牌识别算法的训练数据集,每个字符大约有500~800张不等,每张字符图片的像素大约是28*28,用dropout等正则化避免过拟合的话,训练集是足够的。
2021-05-17 16:08:00 13.21MB 车牌识别训练数据集
1
深圳电信培训中心的徐海蛟博士教学用的真正的Corel-5K图像数据集。5000张图片,标注词,训练数据,测试数据。特征提取说明。吐血奉献! 这是真正的Corel-5K图像集,共包含科雷尔(Corel)公司收集整理的5000幅图片,故名:Corel-5K,童鞋们可用于科学图像实验:分类、检索等。Corel-5k数据集是图像实验的事实标准数据集。 Corel图像库是科雷尔(Corel)公司收集整理的较为丰富的图像库涵盖多个主题。Corel图像库由若干个CD组成,每个CD包含100张大小相等的图像,可以转换成多种格式。每张CD代表一个语义主题,例如有公共汽车、恐龙、海滩等。 Corel-5k自从被提出用于图像标注实验后,已经成为图像实验的标准数据集,被广泛应用于标注算法性能的比较。Corel5k由50张CD组成,包含50个语义主题。 Corel-5k图像库通常被分成三个部分: 4000张图像作为训练集,500张图像作为验证集用来估计模型参数,其余500张作为测试集评价算法性能。使用验证集寻找到最优模型参数后4000张训练集和500张验证集混合起来组成新的训练集。 该图像库中的每张图片被标注1~5个标注词,训练集中总共有374个标注词,在测试集中总共使用了263个标注词。 童鞋们自己去提取相关低层视觉特征:Rgb Lab Hsv Sift Gist HOG等等。 童鞋们完成 svm knn adaboost 逻辑回归 随机森林 mimlsvm mimlknn mimlboost 自定义算法 等等多类与多标签实验吧。Go, ...
2021-05-17 14:32:35 63.76MB Corel Corel-5K 图像训练 图像测试
1
一个6w用户的一个小样本的
2021-05-16 11:06:41 8B 训练集
1
Python:【机器学习】使用sklearn库中的svm实现手写数字识别,并输出错误图片中用到的图片资源
2021-05-16 09:06:23 13.5MB 人工智能 python 机器学习
1
使用者可根据自己的需要选择不同的方式进行训练,车牌正负样本的数据集,该数据集仅包含车牌存在与不存在两种类别。
2021-05-16 07:58:07 17.39MB 数据集 机器学习
1