HWDB-1.1 手写汉字CNN识别模型训练
数据集
使用CASIA-HWDB1.1进行训练和测试,训练集和测试集按照4:1划分,测试集235200张,训练集940800张,
共计1,176,000张图像。该数据集由300个人手写而成,其中包含171个阿拉伯数字和特殊符号,3755类GB2312-80 level-1汉字。
样例图
模型训练
Finetuning from a pretrained model
以googlenet为基础模型,进行finetuning。直接训练全部类别无法收敛时,尝试分阶段训练。
训练后的测试结果为loss-1和loss-2分支准确率为95%,loss-3分支为97%。收敛很快,以0.01为基础学习率,32的batch size,不到10000次迭代就收敛了。
Train 'HWDB-CNN-9Layer' model
虽然googlenet效果尚可,但是由
2021-09-17 08:48:58
66KB
Python
1