用于文档图像变形的门控和分叉堆叠式U-Net模块
捕获文档图像是记录它们的最简单,最常用的方法之一。 但是,这些图像是在手持设备的帮助下捕获的,通常会导致难以消除的不良失真。 我们提出了一个监督的门控和分叉堆叠式U-Net模块,以预测变形网格并从输入中创建无失真的图像。 在对网络进行人工合成的文档图像训练时,将根据真实世界的图像来计算结果。 我们方法的新颖性不仅存在于U-Net的分叉中,以帮助消除网格坐标的混合,而且还存在于使用门控网络的情况下,该门控网络为模型增加了边界和其他分钟线级别的细节。 我们提出的端到端流水线仅在先前方法中使用的数据的8%进行训练后,就可以在DocUNet数据集上实现最新的性能。
要求
所需的软件包:
火炬(> 1.4.0)
火炬视觉(> 0.6.0)
numpy(> 1.18.4)
要安装所有必需的软件包,请使用pip install -r requir
1