建议放到tessdata目录下使用,针对java操作pdf、png、jpg等图片上文字的OCR识别所需要的语言库。
2023-12-22 17:14:10 18.51MB java OCR PDF
1
tesseract的编译文件,可用于qt在windows上进行开发
2023-11-28 19:08:28 39.32MB ocr
1
现有ocr识别小工具,分为两类,一类是依靠网络公司提供的api接口来进行识别,如百度文字识别等,优点是识别准确率高,缺点是没网没授权不能用。另一类就是本地化这种了,现在网上公开的ocr识别工具tesseract-ocr提供中文识别包。再加上使用qq邮箱的截图工具,组建成离线版的OCR识别工具。操作简单,由于使用的是最基本的训练库,准确率比较低,目前能够准确识别pdf中标准文字,带图标的文字可能会识别错误。优化的建议自己训练中文识别库替换tesseract-ocr文件夹内容即可。
2023-11-28 14:31:07 138.54MB python ocr tesseract-ocr 自由截图
1
Tesseract-ocr安装包和中文语言包,亲测可用。注意配置环境变量:TESSDATA_PREFIX,并添加到path中。
2023-09-27 10:38:16 52.12MB ocr
1
该压缩包包含vs2010编译的tesseract3.02.02的动态库以及相应的头文件、tesseract3.02.02的安装包、demo等,在安装好tesseract后,用vs2010打开该demo,即可运行成功,有需要的话可以参考下!
2023-09-22 16:02:07 103.48MB tesseract
1
Tesseract是一个光学字符识别引擎,支持多种操作系统。Tesseract是基于Apache许可证的自由软件,自2006 年起由Google赞助开发。 2006年,Tesseract被认为是最精准的开源光学字符识别引擎之一。
2023-09-10 22:34:18 29.42MB tesseract
1
这是一个Tesseract现成库,非源码免编译。适合想要实现文字识别功能的新手下载。
2023-07-06 19:51:34 49.04MB 软件/插件
1
Tesseract是一款由HP实验室开发由Google维护的开源OCR引擎,由Google对其进行改进、优化,特点是开源,免费,支持多语言,多平台。
2023-07-01 21:15:36 37.61MB OCR tesseract 人工智能 C#
1
Tesseract-OCR 及对应版本的 chi_sim.traindata 字库。   一定要对应否则会报错。错误信息为:actual_tessdata_num_entries_ <= TESSDATA_NUM_ENTRIES:Error:Assert failed:in file tessdatamanager.cpp, line 53"
2023-04-27 09:44:55 26.89MB chi_sim
1
将文件解压后,拷贝到安装路径下的Tesseract-OCR文件夹中的tessdata文件夹下面即可。 主要功能用于识别中文字体 默认下载的Tesseract-OCR安装包中是没有简体中文的文件的。 可以用CMD命令行窗口下可用 tesseract --list-langs 来查看Tesseract-OCR支持语言 如果出现chi_sim,则为成功!
2023-04-20 20:37:58 19.08MB Tesseract-OCR chi_sim 简体中文语言包
1