上传者: 34075348
|
上传时间: 2021-10-05 11:22:54
|
文件大小: 191.19MB
|
文件类型: -
ocr识别 训练自己的字库所需要的工具
1.安装tesseract-ocr-setup-4.0.0-alpha.20180109.exe 一直next ,出现Android选项点击“+”展开勾选语言包 math chinal english 然后下一步,直到结束。
2. https://sourceforge.net/projects/vietocr/files/jTessBoxEditor/
下载jTessBoxEditor,把安装包放到 Tesseract-OCR 目录下。
3.path 环境变量添加路径:我的是C:\Program Files (x86)\Tesseract-OCR
4.cmd 命令输入:tesseract -v 查看是否成功。
5.文字图片放到:Tesseract-OCR\tessdata目录下 我的是test.jpg
6.进入cmd,进入到要识别的图片的路径下,输入命令:tesseract 图片名称 生成的结果文件的名称 字库。
tesseract test.jpg result -l chi_sim
网站
http://www.cnblogs.com/lcawen/articles/7040005.html
tesseract mjorcen.normal.exp0.jpg mjorcen.normal.exp0 -l chi_sim batch.nochop makebox