上传者: 42117485
|
上传时间: 2022-03-04 13:40:10
|
文件大小: 4.34MB
|
文件类型: -
TextFuseNet:具有更丰富融合功能的场景文本检测
该软件在PyTorch中实现了TextFuseNet:具有更丰富的融合功能的场景文本检测。 有关更多详细信息,请参阅我们的论文 。
抽象的
在自然场景中进行任意形状的文本检测是一项极富挑战性的任务。 与现有的仅基于有限特征表示感知文本的文本检测方法不同,我们提出了一个新颖的框架TextFuseNet,以利用融合的丰富特征进行文本检测。 更具体地说,我们建议从特征表示的三个级别(即字符级别,单词级别和全局级别)感知文本,然后引入一种新颖的文本表示融合技术以帮助实现鲁棒的任意文本检测。 多级特征表示可以通过将文本分解为单个字符来充分描述文本,同时仍保持其一般语义。 然后,TextFuseNet使用多路径融合体系结构从不同级别收集并合并文本的功能,该体系结构可以有效地对齐和融合不同的表示形式。 在实践中,我们提出的TextFuseNet可