基于文档图像的文字识别系统包括两个处理步骤。第一步为文字分割,即确定图像中文字序列的区域,并将逻辑相关的多个字符分割开来。第二步是字符识别,即是利用文字分割的结果,基于字符的图像及上下文信息,生成该字符相应的数字化表现形式,以便后期处理,如显示、翻译等。
由此可见,文字分割是OCR(光学字符识别)系统中的关键技术,正确的文字分割是文字识别成功的前提。目前的OCR系统大多是针对文字排列整齐,前景色与背景色对比明显的理想文档图像而设计,这虽然适用于很多印刷文档的情形,但对于文字排列的方向和大小都很随意的手写体文档、图书封面等复杂文档图像却无法提供可靠的文字分割结果,以下列出几种常见比较常见的文档图像。
本文所介绍的方法,即复杂背景下的文字分割方法,希望利用字符的轮廓信息,通过逐步探测的方法完成对复杂文档图像的文字分割,经实验证明,该方法可以有较地解决文字排列不规则、同组文字大小不等、背景色复杂的文字分割问题。
1