这项工作的目的是从字符和单词级别方面识别图像中的文本。 ————————————————————————————————————————————————
此处使用的数据集包含每个手写单词的图像,并以短划线分隔的文件名格式。 第一个字段代表单词id,第二个字段代表单词分割的结果,第三个灰度级将包含该单词的行二值化,第四个字段围绕该单词,第四个边界框,第五个语法标记,第六个单词表示该单词的转录。
数据集是从以下链接下载的:“ (数据/字)—————— ——————————————————————————————————————————
模型:卷积神经网络和序列的融合,使用LSTM / GRU进行序列建模—————————————————————————————————— ————————————
笔记本:
Sequence2Sequence_LSTM.ipynb:
Results
1