tess-two 文件】是基于Android平台的OCR(光学字符识别)库,它是一个开源项目,专门为移动设备设计,用于识别图像中的文本。这个库是Tesseract OCR引擎的一个移植版本,由Google维护并进行了优化,使得在Android系统上运行更加高效。tess-two库包含了预编译的库文件(lib),这些文件已经通过NDK(Native Development Kit)编译完成,可以直接集成到Android应用中使用,无需用户自行编译源代码。 NDK是Google提供的一款工具集,允许开发者使用C和C++原生代码开发Android应用的一部分。使用NDK可以提高性能、利用硬件加速功能,并且处理那些Java无法有效处理的计算密集型任务。在tess-two的情况下,NDK编译的lib文件使得开发者能直接在Android应用中调用OCR功能,而不需要处理底层实现的复杂性。 tess-two库的核心是Tesseract OCR引擎,这是一个强大的文本识别工具,最初由HP开发,后来由Google维护。Tesseract能够识别多种语言的文本,并且可以通过训练来提高对特定字体和格式的识别能力。这个库支持多种图像格式,包括JPEG、PNG、BMP等,可以处理各种各样的图像输入。 在集成tess-two到Android应用时,开发者需要将提供的lib文件添加到项目的jniLibs目录下。然后,通过JNI(Java Native Interface)调用这些库函数,实现与Tesseract引擎的交互。这通常涉及到创建Java层的接口,通过JNI桥接调用C/C++的API,实现图像预处理、识别、后处理等步骤。 为了使用tess-two,开发者还需要配置必要的数据文件,如语言数据包(.traineddata文件)。这些数据包包含了特定语言的训练模型,使得Tesseract能够识别该语言的文本。数据包可以从官方仓库或社区资源下载,根据需要添加到应用中。 此外,tess-two还提供了丰富的API供开发者使用,例如设置识别的语言、定义识别区域、控制输出格式等。这些API可以帮助定制OCR的识别流程,以适应不同应用场景的需求。 在实际应用中,tess-two常用于文档扫描、图片文字提取、车牌识别等场景。由于其开源性质和强大的识别能力,tess-two成为了Android平台上OCR功能的重要选择。然而,需要注意的是,尽管tess-two功能强大,但在处理复杂的图像或者低质量的文本时,识别率可能会受到影响,因此在使用过程中可能需要结合其他图像处理技术来提升识别效果。 tess-two是一个强大的OCR解决方案,通过NDK编译的lib文件简化了在Android应用中的集成过程,使得开发者能够轻松地将文本识别功能引入到自己的项目中。同时,Tesseract OCR引擎的灵活性和可训练性为各种不同的文本识别需求提供了可能性。
2025-08-30 16:56:03 3.23MB tess-two
1
解决了原作者无法运行的问题,另外也没有android M 的限制,在时候的时候可以看到系统只是截取相关图片去做识别,我把截取的图片内容页显示在屏幕上。 使用的时候,需要把tessdata目录及里面的内容放到sdcard 根目录下才能使用。
2022-04-05 10:49:55 19.54MB tess-two
1
OCR开源工具 tess-two 9.1.0 的 jni 库编译生成文件,使用 ndk 14编译。可以直接用,在android studio里面引入 tess-two的库时没找到jni库。
2022-03-15 19:28:35 10.33MB tess-two oc android
1
2019编译,tess-two可用的so文件 测试通过 中英图形识别 2019编译,tess-two可用的so文件 测试通过
2021-12-13 22:56:51 1.97MB tess-two
1
本资源分本地识别和第三方识别,本地识别有些手机需要更改SD卡路径,第三方识别用的是百度云,assets目录下的文件需要自己获取
2021-10-22 10:54:21 36.78MB android tess-two OCR
1
该文件是tess-two项目使用ndk编译生成的.so文件,可以直接引入Android工程中实现图片识别
2021-06-23 12:35:26 3.23MB tess-two android ocr
1
OCR引擎的jar包,在android开发文字识别是的jar包
2021-05-21 13:00:39 135KB OCR引擎
1
该文件是tess-two项目使用ndk编译生成的.so文件,可以直接引入Android工程中实现图片识别
2019-12-21 22:01:06 14.61MB tess-two
1
This is a program that support OCR
2015-06-03 00:00:00 15MB Tess2
1
----基于google tesseract-ocr-3.02版本;2012-12; ----Linux环境编译, 2014-12-01。 直接导入jar包,并把libs目录拷进项目即可使用。 ocr识别库下载 地址:: https://code.google.com/p/tesseract-ocr/downloads/list 调用示例程序: public void testGetUTF8Text() { // First, make sure the eng.traineddata file exists. final String inputText = "hello"; final Bitmap bmp = getTextImage(inputText, 640, 480); // Attempt to initialize the API. final TessBaseAPI baseApi = new TessBaseAPI(); baseApi.init(TESSBASE_PATH, DEFAULT_LANGUAGE); baseApi.setPageSegMode(TessBaseAPI.PageSegMode.PSM_SINGLE_LINE); baseApi.setImage(bmp); // Ensure that the result is correct. final String outputText = baseApi.getUTF8Text(); assertEquals("\"" + outputText + "\" != \"" + inputText + "\"", inputText, outputText); // Ensure that getHOCRText() produced a result. final String hOcr = baseApi.getHOCRText(0); assertNotNull("HOCR result found", hOcr); // Ensure getRegions() works. final Pixa regions = baseApi.getRegions(); assertEquals("Found one region", regions.size(), 1); // Ensure getWords() works. final Pixa words = baseApi.getWords(); assertEquals("Found one word", words.size(), 1); // Iterate through the results. final ResultIterator iterator = baseApi.getResultIterator(); String lastUTF8Text; float lastConfidence; int[] lastBoundingBox; int count = 0; iterator.begin(); do { lastUTF8Text = iterator.getUTF8Text(PageIteratorLevel.RIL_WORD); lastConfidence = iterator.confidence(PageIteratorLevel.RIL_WORD); lastBoundingBox = iterator.getBoundingBox(PageIteratorLevel.RIL_WORD); count++; } while (iterator.next(PageIteratorLevel.RIL_WORD)); // Attempt to shut down the API. baseApi.end(); bmp.recycle(); }
2014-12-02 00:00:00 2.95MB tesseract ocr
1