汉字识别
Pytorch实现中文手写汉字识别
环境
的Ubuntu的:16.04
的Python:3.5.2
PyTorch:1.0.1 gpu
数据集
将数据分为训练和测试文件夹。 在每个文件夹中,将相同类别的图像放在相同的子文件夹中,并用整数标记它们。 像这样:
在这个项目中,我们使用来自 , 的数据集。 也可以使用以下方法下载它:
wget http://www.nlpr.ia.ac.cn/databases/download/feature_data/HWDB1.1trn_gnt.zip
wget http://www.nlpr.ia.ac.cn/databases/download/feature_data/HWDB1.1tst_gnt.zip
该数据集总共包含3755个类。
为了处理它,我们使用来自的python程序。
该博客还使用TensorFlow实现了该数据集
1