神经网络
卷积神经网络的Keras文本识别实现
此实现中有两种可用的模型。 一个基于原始CRNN模型,另一个则包含空间转换器网络层以纠正文本。 但是,性能差别不大,因此由您决定选择哪种型号。
训练
您可以使用Synth90k数据集训练模型,但也可以使用自己的数据。 如果使用自己的数据,则必须重写代码,以便根据数据结构来加载数据。 要下载Synth90k数据集,请转到此并下载MJSynth数据集。
可以将Synth90k数据集放在data/Synth90k或者使用--base_dir参数指定数据集的路径。 基本目录应包括许多包含Synth90k数据的子目录,用于训练,验证和测试数据的注释文件,列出数据集中所有图像的路径的文件以及词典文件。
使用--model参数指定要使用的两个可用模型中的哪个。 默认模型是带有STN层的CRNN。 有关详细信息,请参见config.py 。
运行tra
1