卷积递归神经网络
该软件实现了卷积递归神经网络(CRNN),它结合了CNN,RNN和CTC损失,可用于基于图像的序列识别任务,例如场景文本识别和OCR。 有关详细信息,请参阅我们的论文 。
更新2017年3月14日,一个Docker文件已添加到项目中。 感谢 。
UPDATE 2017年5月1日一PyTorch已作出 。
更新2017年6月19日对于端到端文本检测器+识别器,请通过签出 。
建立
该软件仅在Ubuntu 14.04(x64)上经过测试。 需要启用CUDA的GPU。 要构建项目,请首先安装最新版本的 , 和LMDB。 请分别遵循其安装说明。 在Ubuntu上,可以通过apt-get install liblmdb-dev 。
要构建项目,请转到src/并执行sh build_cpp.sh来构建C ++代码。 如果成功,则应在src/目录中生成一个名为libcrnn.so的文件。
运行演示
演示程序可以在src/demo.lua找到。 在运行演示之前,请从下载预训练的模型。 将下载的模型文件crnn_demo_model.t7放入目录model/crnn_demo/
1