遮罩TextSpotter v3 这是ECCV 2020纸的PyTorch。 Mask TextSpotter v3是一种端到端的可训练场景文本查找器,它采用分段提议网络(SPN)而不是RPN。 Mask TextSpotter v3显着提高了旋转,长宽比和形状的鲁棒性。 与Mask TextSpotter的关系 在这里,我们将Mask TextSpotter系列标记为Mask TextSpotter v1( ,),Mask TextSpotter v2( ,)和Mask TextSpotter v3(ECCV 2020论文)。 该项目是由Creative Commons Attribution-NonCommercial 4.0 International授予的。部分代码是从继承的,后者已获得MIT许可。 安装 要求: Python3(建议使用Python3.7) PyTorch>
1
TextFuseNet:具有更丰富融合功能的场景文本检测 该软件在PyTorch中实现了TextFuseNet:具有更丰富的融合功能的场景文本检测。 有关更多详细信息,请参阅我们的论文 。 抽象的 在自然场景中进行任意形状的文本检测是一项极富挑战性的任务。 与现有的仅基于有限特征表示感知文本的文本检测方法不同,我们提出了一个新颖的框架TextFuseNet,以利用融合的丰富特征进行文本检测。 更具体地说,我们建议从特征表示的三个级别(即字符级别,单词级别和全局级别)感知文本,然后引入一种新颖的文本表示融合技术以帮助实现鲁棒的任意文本检测。 多级特征表示可以通过将文本分解为单个字符来充分描述文本,同时仍保持其一般语义。 然后,TextFuseNet使用多路径融合体系结构从不同级别收集并合并文本的功能,该体系结构可以有效地对齐和融合不同的表示形式。 在实践中,我们提出的TextFuseNet可
2022-03-04 13:40:10 4.34MB scene-text-detection Python
1
神经网络 卷积神经网络的Keras文本识别实现 此实现中有两种可用的模型。 一个基于原始CRNN模型,另一个则包含空间转换器网络层以纠正文本。 但是,性能差别不大,因此由您决定选择哪种型号。 训练 您可以使用Synth90k数据集训练模型,但也可以使用自己的数据。 如果使用自己的数据,则必须重写代码,以便根据数据结构来加载数据。 要下载Synth90k数据集,请转到此并下载MJSynth数据集。 可以将Synth90k数据集放在data/Synth90k或者使用--base_dir参数指定数据集的路径。 基本目录应包括许多包含Synth90k数据的子目录,用于训练,验证和测试数据的注释文件,列出数据集中所有图像的路径的文件以及词典文件。 使用--model参数指定要使用的两个可用模型中的哪个。 默认模型是带有STN层的CRNN。 有关详细信息,请参见config.py 。 运行tra
2021-12-12 15:14:51 59KB ocr keras text-recognition scene-text
1
文本检测和识别综述论文
2021-11-30 17:02:23 2.34MB 文本检测和综述论文
1
Inspired by the fact that edge is an important cue to distinguish texts from background, we propose a novel scene text detection method via edge cue and multiple features, which has two main parts, i.e. candidate character region (CCR) extraction and region classification. For CCR extraction, the ed
2021-02-07 12:06:35 723KB scene text detection; candidate
1