PDF到TXT
使用Python代码对PDF文件进行OCR识别并将文本导出到TXT文件。
LocalOCR :基于
CloudOCR :基于
在Ubuntu上安装LocalOCR
apt-get install python-pyocr python-wand imagemagick
apt-get install libleptonica-dev tesseract-ocr-dev
apt-get install tesseract-ocr-ita
pip install -r requirements.txt
在Ubuntu上设置CloudOCR
安装
apt-get inst
1