针对维吾尔文手写体文本中行分割问题,基于连通域大小将图像中文字分为三类,提出了自适应涂抹细化算法,对主体文本行进行定位;并对第三类连通域中相邻两文本行间粘连的字符进行切割;此外,利用重心范围内的邻域搜索算法,解决了剩余笔画的文本行归附问题。实验结果表明,该方法与常见的水平投影法,分段投影法,及涂抹方法相比具有更好的分割效果。
2022-03-21 18:11:01 589KB 论文研究
1
基于高阶相关聚类的脱机手写文本行分割.pdf
2021-08-20 01:23:35 395KB 聚类 算法 数据结构 参考文献
现有算法对于笔画中含有大量离散笔画点和附加部分的手写体文本,分割性能较低。针对该问题,提出一种基于分段式前景涂抹和背景细化的文本行分割算法。对前景部分实施分段式涂抹,并删除长宽比不满足条件的膨胀区域,以获得文本区域的定位,利用图像背景的细化获取文本行分割线,给出重心判定算法,从而解决上下文本行之间的文字重叠问题。对210幅图片、2 563个文本行进行实验,结果表明,该算法的出错率仅为3.3%,低于水平投影算法、分段式投影算法和聚类算法,能对文本行进行较为完整的分割。
1
针对维吾尔文手写体文本中行分割问题,本文基于连通域大小将图像中文字分为三类,提出了自适应涂抹细化算法,对主体文本行进行定位;并对第三类连通域中相邻两文本行间粘连的字符进行切割;此外,利用重心范围内的邻域搜索算法,解决了剩余笔画的文本行归附问题。实验结果表明,本文方法与常见的水平投影法,分段投影法,及涂抹方法相比具有更好的分割效果。
1