上传者: 42160645
|
上传时间: 2021-10-28 10:57:07
|
文件大小: 6KB
|
文件类型: -
PDF到TXT
使用Python代码对PDF文件进行OCR识别并将文本导出到TXT文件。
LocalOCR :基于
CloudOCR :基于
在Ubuntu上安装LocalOCR
apt-get install python-pyocr python-wand imagemagick
apt-get install libleptonica-dev tesseract-ocr-dev
apt-get install tesseract-ocr-ita
pip install -r requirements.txt
在Ubuntu上设置CloudOCR
安装
apt-get inst