只为小站
首页
域名查询
文件下载
登录
使用python+tesseract-ocr搭建的离线版OCR识别
现有ocr识别小工具,分为两类,一类是依靠网络公司提供的api接口来进行识别,如百度文字识别等,优点是识别准确率高,缺点是没网没授权不能用。另一类就是本地化这种了,现在网上公开的ocr识别工具tesseract-ocr提供中文识别包。再加上使用qq邮箱的截图工具,组建成离线版的OCR识别工具。操作简单,由于使用的是最基本的训练库,准确率比较低,目前能够准确识别pdf中标准文字,带图标的文字可能会识别错误。优化的建议自己训练中文识别库替换tesseract-ocr文件夹内容即可。
2023-11-28 14:31:07
138.54MB
python
ocr
tesseract-ocr
自由截图
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
Android小项目——新闻APP(源码)
IBM CPLEX 12.10 学术版 mac操作系统安装包
数字图像处理[冈萨雷斯]
2019和2021年华为单板通用硬件笔试题及答案
基于Matlab的IEEE14节点潮流计算.zip
CPLEX12.8学术版安装包:cplex_studio128.win-x86-64.exe
基于ray filter的雷达点云地面过滤ROS节点
知网情感词典(HOWNET)
Microsoft Visual C++ 2015-2019 运行库合集,包含32位64位
计算机专业实习日记+实习周记+实习总结
基于蒙特卡洛生成电动汽车充电负荷曲线程序
多目标优化算法(二)MOEAD(附带NSGA2)的文档和代码(MATLAB)
商用密码应用与安全性评估——霍炜.pdf
毕业设计:基于Python的网络爬虫及数据处理(智联招聘)
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
最新下载
shx转shp工具
AX88772烧写工具+UserGuide
中国行政区划shape文件
qt-creator-linux-x86_64-opensource-2.8.1.run
华为服务-随选朗读XAPK安装包V12.1.0
libqsqlodbc.so
2020-FTC-Season:2020-2021 FTC赛季的机器人代码-源码
.Net Core2.1 使用SqlSugar对SqlServer数据库操作
GSOAP2.8.49
信息论基础 第二版 答案
其他资源
使用C5.0决策树识别高风险银行贷款
AccessDatabaseEngine 2007
编译原理-简单计算器
校园导游系统数据结构大作业.zip
豆瓣电影名称类别评分时长评论年份爬取主函数
stm32 esp8266WiFi模块 自动连接WiFi,服务器并传输数据
Java中Excel转图片工具包(纯java)
.NET Core2.0+MVC 用session,cookie实现的sso单点登录
简单的日历日程管理小程序
信息隐藏与数字水印实验指导(电子教案ppt)
proj1-tok-lddavila:GitHub课堂创建的proj1-tok-lddavila-源码
01-虚拟机的安装使用.pdf
SDK 14.4.zip
近化学配比LiNbO
Oracle ocp 052题库
matlab实现模式识别的聚类分类算法
驴妈妈接口文档
清华大学最优滤波课件
基于神经网络的文本无关的说话人识别程序
FFmpeg x86 x64库
网页密码破解
利用BankIt向NCBI在线提交序列
wxPython Application Development Cookbook
python矩阵乘法小程序
片上网络NOC基本架构
报刊订阅管理系统