使用TensorFlow进行手写文本识别
使用TensorFlow(TF)实现并在IAM离线HTR数据集上接受训练的手写文本识别(HTR)系统。 这种神经网络(NN)模型可以识别分段词图像中包含的文本,如下图所示。 由于这些单词图像小于完整文本行的图像,因此可以将NN保持较小,并且在CPU上进行训练是可行的。 正确识别了验证集中的3/4个单词,字符错误率约为10%。 如果您需要更大的输入图像(例如,识别文本行)或想要更好的识别精度,我将给出一些提示,以扩展模型。
运行演示
转到model/目录并解压缩model.zip文件(已在IAM数据集上进行了预训练)。 请注意,将解压缩的文件直接放置在model/目录中,而不要放置在解压缩程序创建的某些子目录中。 然后,转到src/目录并运行python main.py 输入图像和预期输出如下所示。
> python main.py
Validat
2022-07-18 20:32:31
18.17MB
Python
1