只为小站
首页
域名查询
文件下载
登录
文字识别Tesseract-OCR
tessdata
eng.traineddata OCR识别训练数据文件
1. 样本图片准备 2. 打开 jTessBoxEditor ,选择 Tools -> Merge TIFF,打开对话框,选择训练样本所在文件夹,并选中所有要参与训练的样本图片 3 弹出保存对话框,还是选择在当前路径下保存,文件命名为ty.cp.exp6.tif 4. tesseract ty.cp.exp6.tif ty.cp.exp6 -l ty batch.nochop makebox 5. 打开 jTessBoxEditor ,点击 Box Editor -> Open ,打开步骤2中生成的ty.cp.exp6.tif ,会自动关联到 “ty.cp.exp6.box” 文件: 6. 使用echo命令创建字体特征文件 echo cp 0 0 0 0 0>font_properties. 输入内容 “cp 0 0 0 0 0” 7. 使用 tesseract 生成 ty.cp.exp6.tr 训练文件 在终端中执行以下命名: tesseract ty.cp.exp6.tif ty.cp.exp6 nobatch box.train 8. 生成字符集文件 在终端中执行以下命令: unicharset_extractor ty.cp.exp6.box 9. mftraining -F font_properties -U unicharset -O ty.unicharset ty.cp.exp6.tr 与 cntraining ty.cp.exp6.tr 生成之后手工修改 Clustering 过程生成的 4 个文件(inttemp、pffmtable、normproto、shapetable)的名称为 [lang].xxx。这里改为 ty.inttemp、ty.pffmtable、ty.normproto、ty.shapetable。 10. 合并数据文件 在终端中执行以下命令: combine_
tessdata
ty. tesseract b01.jpg result -l ty --psm 7
2024-05-17 17:27:03
31.4MB
Tesseract-OC
训练样本
文字识别
识别训练数据
1
tessdata
1106.zip
最新Tesseract 训练库,非常好用。 下载完成后,解压后,把需要的字库(如:chi_sim.traineddata)放到Tesseract-OCR目录中的
tessdata
目录下就可以使用了。具体使用,如果需要使用简体中文库,在第二个参数中设置lang="chi_sim",python为例:text = pytesseract.image_to_string(Image.open(filename), lang="chi_sim")
2022-12-13 23:37:07
114.36MB
tessdata
训练库
中文字库
1
eng.traineddata
tesseract-ocr语言包,这个是英文的语言包
2022-10-10 20:44:31
2.97MB
tessdata
1
tessdata
-main.zip
https://github.com/tesseract-ocr/
tessdata
2021-12-21 18:10:27
634.97MB
tessdata
ocr
Tess4j
1
tessdata
-4.00.zip 中文包
OCR 中文包
2021-12-15 18:09:38
60.12MB
OCR
语言
中文
1
chi_sim.traineddata
tessdata
简体汉字自己训练的包,针对楷体汉字库,使用
tessdata
ocr 4.0以上训练是用得Tesseract-OCR 5.0 windows 10 64位系统
2021-12-04 13:07:06
12.47MB
tessdata
楷体
3600汉字
自己训练
1
Tesseract-OCR(
tessdata
)训练库 挂低价自己用
语言训练库,放在这里备份自己用。设置了低积分,大家要用的可用方便下载。50积分实在是太贵了。自用是用作tess4j进行验证码识别使用的。
2021-12-03 14:30:50
642.49MB
tessdata
tess4j
1
tessdata
各语言集合包.zip
tesseract4.0版本全语言包合集。
tessdata
全语言包合集。官方github因为限制原因,访问慢,下载慢,故我把所有的语言包都整合到一起了,压缩包形式提供给大家,包括简体中文、英文等等官方提供的全语言。
2021-11-26 22:52:05
451.01MB
tesseract语言包
1
tessdata
.zip
tessdata
.zip
2021-11-18 12:03:43
47.39MB
Tesseract
文字识别
1
tessdata
.zip
可以直接使用的tesseract 英语与中文的训练集
2021-10-14 11:08:21
26.05MB
ocr
tesseract
1
个人信息
点我去登录
购买积分
下载历史
恢复订单
热门下载
倒立摆的模糊控制(基于simulink仿真,适合初学者).rar
基于MATLAB的Filter使用,低通、带通和高通滤波器的仿真
BP_PID控制仿真.rar
PSO-LSSVM的MATLAB代码.rar
长江流域shp.zip
基于Python网络爬虫毕业论文.doc
《MIMO-OFDM无线通信技术及MATLAB实现》高清PDF及源代码
基于STM32的FFT频谱分析+波形识别
CUDA并行程序设计 GPU编程指南-中文扫描539页完整版pdf+高质量英文完整591页原版非扫描pdf
SSM外文文献和翻译(毕设论文精品).doc
采用K-means聚类,实现多维矩阵的聚类,并进行可视化展示(matlab)
韦来生《数理统计》课后习题与答案
基于S函数的BP神经网络PID控制器及Simulink仿真和对应代码模型.zip
matlab时频分析工具箱+安装方法+函数说明+最新版tftb.
stm32f103+OLED12864+FFT音乐频谱(多种显示效果 提供原理图)
最新下载
CATIA-V5-R18-SP6 CRACK 32BIT 64BIT-EXE
TestMem5内存条超频压力测试配置文件汇总anta777
湖科大EDA课程设计--八路抢答器源代码(参考)
微信小程序商城完整源码
城市规划GIS技术应用指南_随书练习数据
基于VUE和SpringBoot的微信小程序商城的设计与实现(论文+源码)-kaic.zip
在线考试系统 数据流图 层次图
effective javascript(中文版 带书签)
结构方程模型贝叶斯方法 李锡钦
DCFA 1.1 生物遗传多样性分析软件
其他资源
学校家教服务管理系统(数据库课程设计).zip
摇臂硬币机-强化学习源代码及其注解(matlab).docx
数据结构实验栈和队列详细实验报告
MAX30102芯片资料跟历程
挑战杯作品
OK335XD uboot
pwt100.xlsx
电子科技大学现代数字信号处理理论及算法
NXE2000 技术手册
在模拟器上实现在任意地址流下求出在 Cache—主存两层存贮层次上的命中率
捕鱼达人java源码(完整功能)
燕山大学组成原理三级项目
abaqus模拟仿真金属成型
12864显示汉字.zip
K60中文资料整合版(英文原版翻译)
stm32 网络远程IAP(支持stm32的网络远程程序烧写,uip协议栈)全网独有
mfc全屏显示窗口
qt快捷下载链接_速度较快的方式
ntleak.dll
爱普生L805清零软件_
2019年超休闲游戏行业发展报告
maven in action Maven 实战 (含源码)
测试方案(硬件类)(模板)
如何正确入门ROS-TopLiu-硬创公开课
Java 课程设计-一个简单的画图程序
二次样条曲线算法及二次曲面算法