LMDB格式的CUTE80资源 包括288张非常倾斜扭曲的高难度图像 如何使用可见博客 https://blog.csdn.net/zhaominyiz/article/details/104834770
2022-03-31 14:50:36 7.13MB CUTE80 OCR 场景文本识别
1
Imdb格式的SVT数据集 相关的制作、使用代码可见博客 https://blog.csdn.net/zhaominyiz/article/details/104834770
2022-03-17 16:25:49 1.21MB lmdb ocr 数据集 SVT
1
Imdb格式的ICDAR2015数据集 相关的制作、使用代码可见博客 https://blog.csdn.net/zhaominyiz/article/details/104834770
2022-01-10 19:14:08 19.48MB ocr 数据集 ICDAR2015 lmdb
1
自然场景中的文本识别(scene text recognition, STR)是计算机视觉和模式识别领域的研究热点。最近华南理工的学者发布了关于STR的综述论文,总结了STR的基本问题和最先进的技术,介绍新的见解和想法,并展望未来的趋势来展示STR的全貌。
2022-01-07 21:42:39 3.51MB 《场景文本识别》
1
基于变压器的场景文本识别(Transformer-STR) 我的基于场景文本识别(STR)新方法的PyTorch实现。 我改编了由设计的四阶段STR框架,并替换了Pred. 变压器的舞台。 配备了Transformer,此方法在CUTE80上优于上述深层文本识别基准的最佳模型7.6% 。 从下载预训练的砝码 该预训练权重在Synthetic数据集上进行了约700K次迭代训练。 Git克隆此仓库并下载权重文件,将其移至checkpoints目录。 从 下载lmdb数据集以进行训练和评估(由) data_lmdb_release.zip包含以下内容。 训练数据集: [1]和 [2] 验证数据集:训练集 [3], [4], [5]和 [6]的并集。 评估数据集:基准评估数据集,由 [5], [6], IC03 [7], IC13 [3], IC15 [4], SVTP [8]和
2022-01-02 13:59:23 154KB ocr text-recognition transformer-str Python
1
神经网络 卷积神经网络的Keras文本识别实现 此实现中有两种可用的模型。 一个基于原始CRNN模型,另一个则包含空间转换器网络层以纠正文本。 但是,性能差别不大,因此由您决定选择哪种型号。 训练 您可以使用Synth90k数据集训练模型,但也可以使用自己的数据。 如果使用自己的数据,则必须重写代码,以便根据数据结构来加载数据。 要下载Synth90k数据集,请转到此并下载MJSynth数据集。 可以将Synth90k数据集放在data/Synth90k或者使用--base_dir参数指定数据集的路径。 基本目录应包括许多包含Synth90k数据的子目录,用于训练,验证和测试数据的注释文件,列出数据集中所有图像的路径的文件以及词典文件。 使用--model参数指定要使用的两个可用模型中的哪个。 默认模型是带有STN层的CRNN。 有关详细信息,请参见config.py 。 运行tra
2021-12-12 15:14:51 59KB ocr keras text-recognition scene-text
1
Imdb格式的IIIT5k数据集 相关的制作、使用代码可见博客 https://blog.csdn.net/zhaominyiz/article/details/104834770
2021-09-18 10:33:05 40.13MB IIIT5K OCR 数据集
1
复杂场景下的文本识别技术 人工智能 OCR 相 结合 传统识别技术区别
2021-05-11 20:24:56 11.75MB 文本识别
1
完整Synth90k数据集资源,下载可用
1
Synthetic Chinese Data数据集百度云盘
1