研究深度学习和卷积神经网络的同学都知道Mnist这个数据库,它是一个手写数字的图像数据集,可以用来作为手写数字识别的神经网络训练的基准测试数据库。原版数据集是以特定格式存储的四个文件,包括乱序排列的60000个训练样本与10000个测试样本,以及每个样本对应的标签向量。现将其中的图片从原文件中读取出来,按照原文件的顺序存储为Matlab的mat数据变量格式,可使用Matlab直接读取,以便各位同学进行科研与实验之用。
压缩包里包含四个Matlab数据变量文件
train_imgSet.mat:训练集图像样本集
train_lable.mat:训练集图像标签
test_imgSet.mat:测试集图像样本集
test_lable.mat:测试集图像标签
图像变量的结构为三维矩阵,前两维为20x20像素的图像矩阵,数据类型为double。第三维为图像序号。
标签变量的结构为一维向量,对应于图像变量中每条样本的第三维图像序号,存储的内容为0~9的实数,表示对应图像矩阵所代表的数字。
原数据集下载地址为:http://yann.lecun.com/exdb/mnist/
1