解压后执行tesseract-ocr-setup-3.02.02.exe安装,tessdata 目录存放的是语言字库文件,本安装程序默认包含了英文字库。如果想识别中文将压缩包中的chi_sim.traineddata放入tessdata即可。
2019-12-21 18:49:33 29.91MB OCR识别 OCR中文识别 tesseract OCR安装包
1
Tensorflow文字定位、tesseract识别
2019-12-21 18:49:11 66MB 文字定位
1
tesseract 训练的数字字库,包含宋体、黑体、微软雅黑的0-9数字,
2019-12-21 18:44:18 134KB tesseract 数字字库
1
适合python的库,下载较慢放上来方便大家,运行tesserocr-2.4.0-cp37-cp37m-win_amd64.whl即可安装完毕。
2019-12-18 00:10:16 3.47MB tesserocr tesseract python 文字识别
1
建立tess4j Java工程所需的4个jar包,附有tess4j的官网地址已经tess4j.jar的源码。是整理所得,大部分资料都可从官网获得。
2015-11-19 00:00:00 19.73MB tesseract tess4j
1
tesseract3.02 vs2012 工程源码 官方网站只提供了vs2008和vs2012的,本工程的源码包括tesseract依赖的leptonica-1.68的源码
2015-08-01 00:00:00 15.01MB tesseract vs2012
1
Tesseract 或tess4j识别中文需要的语言包chi_sim.traineddata
2015-05-05 00:00:00 18.82MB Tesseract tess4j
1
----基于google tesseract-ocr-3.02版本;2012-12; ----Linux环境编译, 2014-12-01。 直接导入jar包,并把libs目录拷进项目即可使用。 ocr识别库下载 地址:: https://code.google.com/p/tesseract-ocr/downloads/list 调用示例程序: public void testGetUTF8Text() { // First, make sure the eng.traineddata file exists. final String inputText = "hello"; final Bitmap bmp = getTextImage(inputText, 640, 480); // Attempt to initialize the API. final TessBaseAPI baseApi = new TessBaseAPI(); baseApi.init(TESSBASE_PATH, DEFAULT_LANGUAGE); baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_LINE); baseApi.setImage(bmp); // Ensure that the result is correct. final String outputText = baseApi.getUTF8Text(); assertEquals("\"" + outputText + "\" != \"" + inputText + "\"", inputText, outputText); // Ensure that getHOCRText() produced a result. final String hOcr = baseApi.getHOCRText(0); assertNotNull("HOCR result found", hOcr); // Ensure getRegions() works. final Pixa regions = baseApi.getRegions(); assertEquals("Found one region", regions.size(), 1); // Ensure getWords() works. final Pixa words = baseApi.getWords(); assertEquals("Found one word", words.size(), 1); // Iterate through the results. final ResultIterator iterator = baseApi.getResultIterator(); String lastUTF8Text; float lastConfidence; int[] lastBoundingBox; int count = 0; iterator.begin(); do { lastUTF8Text = iterator.getUTF8Text(PageIteratorLevel.RIL_WORD); lastConfidence = iterator.confidence(PageIteratorLevel.RIL_WORD); lastBoundingBox = iterator.getBoundingBox(PageIteratorLevel.RIL_WORD); count++; } while (iterator.next(PageIteratorLevel.RIL_WORD)); // Attempt to shut down the API. baseApi.end(); bmp.recycle(); }
2014-12-02 00:00:00 2.95MB tesseract ocr
1
Java 使用 Tess4J 进行 图片文字识别 笔记,Tesseract是一个开源的OCR(Optical Character Recognition,光学字符识别)引擎
2014-11-18 00:00:00 21.21MB OCR tess4j Tesseract
1
开源OCR引擎Tesseract的Java API封装Tess4J 1.0版本
2013-01-19 00:00:00 5.24MB Tess4J Tesseract OCR
1