.epub版的 Windows PE 权威指南,可直接提取文本内容,可用浏览器直接打开,全书签,方便使用
2021-07-27 09:25:49 10.95MB Windows PE 权威指南 .epub
1
pdf格式存在的,比如:论文,技术文档,标准文件,书籍等。pdf格式使机器提取信息格外困难。 pdf的文本和表格处理用多种方式可以实现, 本文介绍pdfplumber对文本和表格提取。这个库在GitHub上星600多,不过使用起来很方便, 效果也很好,可以满足对pdf中信息的提取需求。
2021-07-23 09:13:47 1004KB pdf
1
从一张图片中,把文字圈出来。这一步骤对OCR(Optical Character Recognition)非常有用,因为一般的OCR引擎只是拿来识别文字,并没有对图片做预处理,因此精度可能会收到图片质量影响。 我们这里只是粗略的查找文字区域,并没有进一步地处理图片。 请把test.png拷到bin\debug相应的目录
2021-07-08 15:35:24 146.21MB C# OpenCVsharp OpenCV 图像识别
1
1、双击“天若OCR文字识别.exe”可执行程序,会有一个小图标出现在左下角任务栏中; 2、鼠标放到小图标上会提示“上级开始截图识别”,然后双击该图标,即可选择区域进行OCR识别
1
所有人
2021-03-17 20:16:11 891KB 文字提取工具
1
用Python实现的一个小工具,下载包包含源码和编译后打包的可执行文件。 可以根据配置从PDF文档里面提取一些关键字并写入Excel, 此工具适合转换一些批量的固定格式模板的PDF到Excel, .Docx文档可以用Word先转为PDF再使用此工具 PDF2Excel 目录下为python源码 PDF2Excel/dist 下为打包好相关依赖的可执行文件 config.ini文件为配置文件,可以配置想提取的关键字和位置信息 配置文件说明: [keyword-n] --标识要提取的第n个关键字相关信息 name=姓名 --标识具体的关键字 shift=3 --提取目标内容相对关键字的偏移量,可以是负值,表示目标内容在关键字左侧,具体偏移几个字符可以预估,然后测试微调 length=3 --提取目标字符的长度 命令行显示“存放文档的文件夹名称” 是指源PDF文档位置,可以根据自己的文件夹命名输入
2021-03-07 19:02:13 65.07MB PDF提取文字信息到Excel
1
部署环境后,将extraction.exe 放置到需要提取文字的图片文件夹并打开,识别后会将图片文字以图片文字为命名放置到桌面。
2021-03-04 19:47:43 39.37MB 批量 文字提取 文字识别 OCR
1
word提取文字所需的一系列jar,word提取文字所需的一系列jar
2019-12-21 20:42:50 10.14MB word提取文字
1
django富文本使用简明教程(基于百度Ueditor编辑器,windows平台) 可以提取富文本文字和图片 python 3.6,django==1.11.14 实现过程可以参考教程 https://mp.csdn.net/postedit/88389535
2019-12-21 20:28:57 3.43MB python django 富文本 提取文字和图
1