和声2
编辑框
Tesseract
box文件的基于
Web
的编辑器。
box文件包含带有单个字符及其边界框的行:
t
700
1000
750
1050
0
h
750
1000
800
1050
0
e
800
1000
850
1050
0
如果您想训练
Google
的
Tesseract
OCR
工具,您需要使用box文件。
在“训练模式”下运行时,Tesseract
输出box数据而不是普通字母。
您更正这些box文件中的错误并将它们反馈给
Tesseract。
boxedit
可以帮助您做到这一点。
用法
========
用法:
在您喜欢的浏览器中打开index.html
。
将.box文件和相应的图像文件拖到页面上。
您可以同时拖动它们或一个一个拖动它们:
通过以下方式修复错误:
1.
编辑左侧文本框中的原始框数据。
这些框将在右侧更新。
这对于删除框或四处移动非常方便。
2.
单击图像中的框以将其选中并键入字母。
这将更改相应的框数据并推进选择,允许您键入您看到的文本。
3.
单击一个框并使用“拆分”菜单修复合并字符。
地方发展
要开始,请运行:
git
clon
2023-02-05 10:46:38
457KB
系统开源
1