1. 样本图片准备 2. 打开 jTessBoxEditor ,选择 Tools -> Merge TIFF,打开对话框,选择训练样本所在文件夹,并选中所有要参与训练的样本图片 3 弹出保存对话框,还是选择在当前路径下保存,文件命名为ty.cp.exp6.tif 4. tesseract ty.cp.exp6.tif ty.cp.exp6 -l ty batch.nochop makebox 5. 打开 jTessBoxEditor ,点击 Box Editor -> Open ,打开步骤2中生成的ty.cp.exp6.tif ,会自动关联到 “ty.cp.exp6.box” 文件: 6. 使用echo命令创建字体特征文件 echo cp 0 0 0 0 0>font_properties. 输入内容 “cp 0 0 0 0 0” 7. 使用 tesseract 生成 ty.cp.exp6.tr 训练文件 在终端中执行以下命名: tesseract ty.cp.exp6.tif ty.cp.exp6 nobatch box.train 8. 生成字符集文件 在终端中执行以下命令: unicharset_extractor ty.cp.exp6.box 9. mftraining -F font_properties -U unicharset -O ty.unicharset ty.cp.exp6.tr 与 cntraining ty.cp.exp6.tr 生成之后手工修改 Clustering 过程生成的 4 个文件(inttemp、pffmtable、normproto、shapetable)的名称为 [lang].xxx。这里改为 ty.inttemp、ty.pffmtable、ty.normproto、ty.shapetable。 10. 合并数据文件 在终端中执行以下命令: combine_tessdata ty. tesseract b01.jpg result -l ty --psm 7
1
文字识别用到了Tesseract-ocr,另外一个用到了图片处理函数bitmap包括灰度化
2022-05-05 15:10:26 157.18MB Tesseract-oc 图片处理 文字识别
1
python配合tesseract-OCR进行图像识别例子,需要自己安装python环境,代码中的path需要改成自己的,资源包括已经训练完成的字符库,python源码,训练需要的图片资源,待识别图片,有python环境可以直接运行
2021-11-26 17:11:27 86.78MB tesseract-OC python
1
tesseract-ocr中文语言字库文件:包含chi_sim【中文简体】、chi_sim_vert【中文简体】、chi_tra【中文繁体】、chi_tra_vert【中文繁体】、eng【英文】,下载完成后解压,然后将该文件剪切到tessdata目录下去就可以了。
2021-06-24 10:28:49 76.24MB Tesseract-OC 文字识别
1
Tesseract,一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎,与Microsoft Office Document Imaging(MODI)相比,我们可以不断的训练的库,使图像转换文本的能力不断增强;如果团队深度需要,还可以以它为模板,开发出符合自身需求的OCR引擎。
2021-05-25 10:06:50 33.79MB tesseract-oc
1
Tesseract-OCR的中文训练库,解压到Tesseract-OCR\tessdata目录
2020-01-03 11:32:00 18.82MB Tesseract-OC 中文训练库
1
自己训练的常用2500汉字宋体字库,能够识别简体中文,可适用于3.02版和最新版本。
2019-12-21 20:19:10 7.29MB tesseract-oc JTessBoxEdit
1
2018年8月编译配置最新Tesseract4,效果甩3.x版本几条街。官网示范程序有错,本示例程序堪称全网最好示例程序。本程序头文件、库和字典都已打包好,只要你装有VS2015就可以正常编译.调试.运行,不用配置任何环境变量。此为x86版本,若要x64版本,参考本人博客https://mp.csdn.net/postedit/81746904
2019-12-21 19:24:35 57.89MB tesseract-oc
1
使用详见我的博客:https://blog.csdn.net/HorseRoll/article/details/83310677
2019-12-21 18:50:10 44.3MB OCR Tesseract Tesseract-OC
1