论文连接:https://arxiv.org/pdf/1911.08947.pdf
github链接:github.com
网络结构
首先,图像输入特征提取主干,提取特征;
其次,特征金字塔上采样到相同的尺寸,并进行特征级联得到特征F;
然后,特征F用于预测概率图(probability map P)和阈值图(threshold map T)
最后,通过P和F计算近似二值图(approximate binary map B)
在训练期间对P,T,B进行监督训练,P和B是用的相同的监督信号(label)。在推理时,只需要P或B就可以得到文本框。
网络输出:
1、probability map, wh1 , 代表像素点是文本的概率
2、threshhold map, wh1, 每个像素点的阈值
3、binary map, wh1, 由1,2计算得到,计算公式为DB公式
文章链接:https://wanghao.blog.csdn.net/article/details/123904386
2022-04-06 03:11:59
377.46MB
ocr